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本 书 从 零 基 础 入 门 着 手 ,通过 合理 的 编排 ,首先 引导 读者 循序 渐进 地 学 习 Python 基本 语法 和 语义 ,再 
掌握 诸如 文件 和 数据 库 的 处 理 、 面 向 对 象 编程 .开发 图 形 用 户 界面 、 网 络 和 多 线程 编程 等 实用 技术 ,最 后 拓 


展 了 Python 的 
本 书 通过 
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一 些 热门 应 用 ,如 大 数据 和 机 器 学 习 。 
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用 。 总 之 ,对 于 


第 一 次 接触 编程 的 人 来 说 ,这 是 一 本 非常 适合 的 书 。 
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在 这 本 书 的 创作 过 程 中 ,有 过 很 多 的 构思 ,是 精炼 直接 还 是 面面俱到 ， 
是 道理 连篇 还 是 实用 为 主 …… 经 过 深思 熟 虑 ,最 终 的 呈现 是 : 涉及 技术 的 
地 方 , 用 简练 的 语言 去 介绍 ,希望 读者 能 够 用 最 短 的 时 间 了 解 一 个 新 功能 或 
者 一 个 陌生 的 领域 ;涉及 思想 认 知 方面 ,用 生活 化 的 语言 进行 详细 说 明 。 

读者 还 会 发 现 本 书 在 介绍 一 些 基础 知识 的 时 候 , 会 一些“ 废话”?。 对 
于 有 编程 经 验 的 人 来 讲 , 确 实 是 废话 ;而 对 于 一 个 新 手 来 讲 , 我 希望 这 些 “ 废 
话 ” 是 一 个 过 来 人 的 经 验 分享 , 就 好 像 有 个 老师 在 你 面前 妮 九 道 来 ,而 不 是 
几 和 名 话 就 涵盖 很 多 的 概念 和 知识 点 ,让 新 手 可 能 想 破 头 也 想 不 通 这 里 面 的 
来 龙 去 脉 。 我 希望 通过 这 样 的 方式 能 够 帮助 新 手 树 立正 确 的 编程 观念 , 继 
而 产生 潜移默化 的 影响 。 

至 于 这 本 书 ,我 希望 它 是 一 个 指引 ,而 不 是 什么 宝典 大 全 。 当 读 过 之 
后 ,我 希望 读者 能 脱离 这 本 书 , 形 成 自己 的 思维 方式 和 解决 问题 的 方法 ,而 
不 是 总 来 翻 这 本 书 寻 找 答案 。 书 中 不 单 讲解 语言 本 身 ,更 是 注重 培养 读者 
的 编程 意识 ,通过 经 验 的 分 享 和 抛 出 问题 的 方式 培养 读者 独立 探索 和 解决 
新 间 题 的 能 力 ,这 也 是 一 个 合格 的 程序 员 所 需要 具备 的 素质 。 

适合 读者 

零 基 础 的 初学 者 。 

掌握 其 他 语言 的 程序 员 。 

需要 编程 解决 问题 的 运 维 工程 师 。 

工作 中 需要 用 到 程序 解决 问题 的 非 计 算 机 领域 工作 者 。 

编程 爱好 者 。 

本 科 及 大 专 在 校 学 生 。 

想 要 报考 全 国 计 算 机 等 级 考试 的 读者 。 


如 何 学 习 本 书 


本 书 共 3 篇 18 章 ,分 别 为 基础 入 门 篇 . 进 阶 应 用 篇 和 拓展 案例 篇 。 
基础 入 门 篇 为 第 0 章 至 第 7 章 , 内 容 从 克服 编程 丽 恨 开始 ,逐步 渗透 编 
程 思想 ,建立 编程 的 信心 。 知 识 从 Python 安装 开始 ,以 合理 的 递 进 式 知识 结 
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构 编 排 ,介绍 了 Python 的 数据 类 型 、 语 身 语法 以 及 函数 和 模块 化 编程 ,每 个 章节 的 重要 知 
识 点 都 配备 了 生动 的 教学 视频 ,可 以 采取 文字 和 视频 同步 学 习 的 方式 ,能 更 快 . 更 好 地 吸收 
新 知识 。 

进 阶 应 用 篇 为 第 8 章 至 第 15 章 , 主 要 介绍 文件 和 数据 持久 化 \ 面 向 对 象 编程 .异常 处 
理 、 开 发 图 形 用 户 界 面 、 正 则 表达 式 以 及 爬 贝 入 门 、 多 线程 编程 和 网 络 应 用 编程 等 相关 实用 
技能 ,在 其 中 还 适当 穿插 了 一 些 自学 任务 。 通 过 这 部 分 学 习 , 可 以 让 读者 对 Python 的 应 用 
有 更 多 了 解 ,增强 自学 能 力 , 达 到 学 一 通 三 的 效果 ,从 而 可 以 在 自己 的 实际 工作 中 快速 学 习 
Python 相关 的 、 新 的 模块 和 功能 并 加 以 应 用 。 各 章节 均 配备 了 视频 教程 。 

拓展 案例 篇 是 第 16 章 至 第 18 章 , 每 章 通 过 一 个 案例 讲解 某 一 个 领域 的 应 用 。 因 为 
Python 的 特殊 性 ,Python 在 很 多 领域 都 有 所 应 用 ,作为 新 手 可 能 没 办 法 在 短 时 间 内 精通 
Python 在 所 有 领域 的 应 用 。 这 里 选取 了 三 个 案例 ,分 别 是 大 数据 语音 识别 和 机 器 学 习 入 
门 ,每 个 案例 都 可 以 帮助 新 手 对 相关 领域 快速 了 解 并 入 门 , 如 果 对 哪个 方面 感 兴趣 ,或 者 在 
工作 中 有 需要 ,可 以 再 深入 进行 学 习 研 究 , 这 几 个 案例 都 是 非常 好 的 入 门 指南 。 

另外 ,在 本 书 中 还 有 一 些 特别 的 设计 ,比如 ,在 基础 入 门 和 进 阶 应 用 部 分 有 一 个 叫 ( 英 
雄 无 敌 ) 的 游戏 项 目 , 这 其 实 并 不 是 教 你 开发 游戏 的 教程 ,只 是 通过 一 种 载体 让 那些 看 起 来 
无 关 的 语法 或 者 功能 有 一 个 有 机 的 结合 ,对 零散 知识 点 与 程序 设计 有 一 个 系统 的 认 知 。 随 
着 学 习 的 深入 ,你 可 以 让 游戏 的 功能 越 来 越 完善 ,甚至 超出 书 中 的 设计 ,这 个 游戏 可 以 从 最 
简单 的 文字 形式 发 展 成 游戏 界面 ;从 单纯 的 文字 到 具备 复杂 故事 情节 ;可 以 从 单机 到 网 络 。 
总 之 ,只 要 你 学 了 新 的 知识 就 可 以 想 想 这 个 功能 可 以 在 游戏 中 用 来 干什么 。 在 书 里 很 多 地 
方 我 都 做 了 引导 ,如 果 你 有 想法 ,就 去 实现 吧 ! 

在 本 书 的 “ 动 动手 ”部 分 也 留 了 一 些 开 放 式 的 问题 ,需要 自己 去 考虑 和 设计 ,有 些 做 了 
视频 演示 ,如 果 想 不 通 ,也 可 以 到 QQ 交流 群 中 跟 大 家 进行 探讨 。 

至 于 实验 环境 , 书 中 主要 的 案例 都 是 基于 Python 3 十 Windows 10 的 环境 ,个 别 拓展 内 
容 会 涉及 Linux 和 Python 2, 不 过 请 放心 ,一 定 会 在 你 的 理解 范围 内 。 

相关 资源 

书 中 提供 了 丰富 的 代码 演示 ,所 有 的 代码 都 可 以 在 Github 得 到 ,Github 网 址 是 
https://github. com/milozou/CrazyPython/ 。 代 码 按 章 分 18 个 目录 保存 。 

如 果 想 跟 更 多 人 在 线 交 流 经 验 , 可 以 加 入 疯狂 的 Python QQ 交流 群 -1: 814674076。 

如 果 有 内 容 勘 误 方面 的 意见 ,欢迎 直接 发 邮件 至 zouqixian@gmail. com 。 


最 后 ,希望 大 家 在 提 到 本 书 时 ,不 会 说 这 是 一 本 Python 编程 的 宝典 ,我 希望 大 家 会 说 
这 是 一 本 武功 心 法 。 看 完 之 后 ,本 一 灌顶 ,打通 了 任 督 二 脉 , 内 功 深厚 ,哈哈 。 


纯正 全 
2019 年 1 月 
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万 事 开 头 难 ,学 习 编 程 似乎 也 不 容易 。 对 于 新 手 来 讲 , 在 眼花 练 乱 
的 资讯 .教程 分 享 以 及 五 花 八 门 的 资源 中 ,首先 需要 的 就 是 选 对 学 习 
路 线 。 有 太 多 从 入 门 到 放弃 的 例子 ,就 是 因为 没有 找到 学 习 的 主线 ,把 
时 间 精 力 都 浪费 在 无 用 的 知识 和 信息 上 ,最 后 看 起 来 好 像 学 了 很 多 东 
西 ,但 是 真正 有 用 的 也 就 是 十 分 之 一 。 

学 习 Python 编程 不 同 于 其 他 计算 机 技术 ,并 不 是 罗列 出 一 堆 知 识 
点 ,然后 逐一 记 住 它们 ,也 不 是 同样 功能 的 几 个 方法 都 要 掌握 。 很 多 文章 或 书籍 都 会 堆砌 
知识 点 ,相同 功能 也 要 列 出 几 个 ,这 就 好 像 孔 乙己 在 说 “ 回 ? 字 有 几 种 写法 一 样 。 新 手 初 看 ， 
感觉 内 容 很 丰富 ,学 着 学 着 就 没 动力 了 , 真 的 是 体验 了 “学 海 无 涯 ”。 而 高 手 往往 会 觉得 拼 
次 .罗列 知识 点 的 方式 过 于 累 歼 。 其 实 ,学 习 编 程 把 最 主要 的 核心 学 会 ,再 掌握 解决 问题 的 
正确 思路 ,就 已 经 算是 和 人 门 了 ,Python 更 是 如 此 。 

这 是 个 崇尚 “最 好 的 办 法 只 有 一 个 ”的 语言 ,无 须 学 那么 多 , 遇 到 需要 学 习 的 新 功能 , 运 
用 已 经 掌握 的 方法 ,很 快 就 可 以 上 手 并 运用 。 这 也 是 一 个 合格 程序 员 应 该 掌握 的 能 力 。 


[> 有 (及 四 克服 编程 恐惧 


新 手 学习 编 程 之 前 通常 会 有 两 种 情绪 : 好 奇 和 念 惧 。 通 常 小 孩子 或 者 纯 小 白 对 编程 的 
好 奇 心 会 比较 大 ,好 奇 是 因为 觉得 编程 很 神奇 ,可 以 让 计算 机 帮助 我 们 完成 更 多 的 工作 ;而 
顾虑 比较 多 的 人 就 会 产生 恐惧 或 者 避 难 心理 , 恺 惧 是 因为 对 未 知 的 迷茫 和 无 序 。 比 如 很 多 
人 在 开始 学 习 之 前 会 先 说 “我 的 英语 不 好 ”我 的 数学 不 好 ”等 类 似 的 问题 。 

Python 可 以 说 是 最 适合 编程 人 门 的 语言 了 ,少儿 接触 编程 ,Python 也 是 最 好 的 选择 。 
既然 如 此 , 那 就 说 明 这 门 语言 本 身 其 实 是 非常 简单 的 。 

其 实 , 对 于 新 手 来 说 ,首先 要 搞 明白 的 事情 就 是 到 底 什 么 是 编程 ,以 及 明确 编程 的 困难 
之 处 到 底 在 哪里 。 

学 编程 就 好 像 学 习 写 文章 ,不 同 的 是 ,文章 是 写 给 人 看 的 ,程序 是 写 给 计算 机 看 的 。 我 
们 都 有 过 学 习 写 文 章 的 经 历 , 那 是 一 个 过 程 : 从 陌生 到 熟悉 的 过 程 , 从 笨拙 到 巧妙 的 过 程 。 
没有 人 是 刚 认识 字 就 可 以 写 出 漂亮 文章 的 。 

想 想 我 们 学 习 写 作文 的 过 程 ,最 开始 的 时 候 并 不 是 一 上 来 老师 就 跟 你 说 :“ 来 ,我 们 现 
在 学 习 写 作文 .” 也 不 是 先 学 汉字 或 者 拼音 ,我 们 首先 学 会 的 是 把 想法 用 语言 表达 出 来 ,也 





疯狂 的 Python 
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就 是 说 ,我 们 最 先 会 的 是 在 脑子 里 形成 想法 , 那 可 能 是 下 意识 的 ,也 可 能 是 经 过 深思 熟 虑 产 
生 的 想法 。 有 了 想法 之 后 ,我 们 可 以 通过 口述 表达 出 来 ,然后 才 逐 渐 开 始 学 习 拼 音 、 汉 字 、 
词 .句子 短语 段落 .文章 ,造句 写 文章 的 规矩 和 语法 以 及 不 同类 型 文章 的 结构 等 。 

学 好 中 文 就 可 以 写 出 中 文 给 懂 中 文 的 人 看 ,而 编程 就 是 把 想法 变 成 程序 给 计算 机 看 。 
先 会 说 话 后 写作 ,学 习 编 程 也 是 一 样 ,首先 是 要 有 想法 ,而 不 是 先 想 要 写 什么 代码 。 有 了 想 
法 之 后 ,就 是 怎么 把 想法 通过 程序 实现 出 来 。 编 程 就 是 把 想法 变 成 代码 的 过 程 。 互 联网 行 
业 的 很 多 创业 者 都 有 一 个 共同 的 困境 , 那 就 是 “我 有 一 个 好 想法 ,就 差 一 个 程序 员 了 ”。 有 
了 Python, 想 法 变 程序 就 容易 得 多 了 。 

至 于 学 习 编 程 的 困难 之 处 ,让 我 们 想 想 在 学 习 除 了 母语 之 外 另 一 门 语言 的 过 程 吧 。 或 
许 你 会 说 “我 的 英语 很 好 ”我 的 法 语 很 厉害 ”, 那 么 ,如 果 用 这 门 外 语 写 诗 呢 ? 想 想 我 们 的 
古诗 ,要 合 斩 押韵 ,还 有 更 难 的 八股 文 ,你 能 想象 用 法 语 写 古诗 、 英 语 写 八 股 文 吗 ? 感受 到 
难度 在 哪儿 了 吗 ? 古诗 跟 普 通 白话 文章 的 区 别 就 在 于 ,古诗 有 字数 限制 ,有 韵脚 的 要 求 。 
而 学 习 一 门 外 语 并 且 用 外 语 写 诗 面临 两 个 问题 : 

(1) 学 习 一 门 陌生 的 语言 。 

(2) 按照 这 门 语言 的 语法 和 韵脚 写 诗 。 

编程 要 面临 的 困难 也 是 这 两 个 问题 : 

(1) 不 知道 或 不 熟悉 编程 语言 的 语法 和 语义 。 

(2) 不 知道 如 何 让 计算 机 解决 问题 (就 好 像 不 知道 怎么 用 法 语 写 诗 一 样 )。 

所 以 ,编程 的 困难 就 在 于 ,要 学 习 一 门 跟 母 语 不 一 样 的 语言 ,而 且 为 了 计算 机 能 明白 ， 
还 要 学 习 一 些 特定 的 语法 和 规则 ;同时 还 要 用 这 个 语言 去 解决 问题 。 

明确 了 编程 的 困难 , 接 下 来 就 是 怎样 克服 困难 。 学 习 编 程 最 好 的 办 法 就 是 动手 不 断 地 
编程 ,就 跟 学 习 所 有 的 东西 一 样 。 想 要 做 一 个 好 的 守门 员 , 就 要 熟悉 球 性 ,不 断 练习 各 种 基 
本 动作 (语法 ) 熟悉 规则 (编码 规范 ) 、 研 究 团 队 策 略 ( 算 法 ) 等 。 其 中 最 好 的 做 法 就 是 多 练 
习 、 多 实战 。 

最 后 ,你 需要 明确 编程 的 两 个 层次 : 

(1) 找到 解决 问题 的 方法 。 

(2) 编写 出 好 程序 。 


> 用 oo 如 何 写 出 好 程序 


出 色 大 牛 的 程序 员 和 菜鸟 程序 员 的 差别 就 在 于 能 不 能 写 出 好 程序 。 在 我 们 知道 了 编 
程 语言 (比如 Python) 的 语法 和 语义 后 ,怎样 才能 写 出 好 程序 呢 ? 

关于 什么 是 好 程序 ,其 定义 是 仁 人 见 仁 智者 见 智 , 跟 行 业内 的 朋友 们 聊天 ,特别 是 带 团 
队 的 CTO 们 ,经 常会 听 到 各 种 吐槽 。 比 如 : 

(1) 明明 写 的 屎 汉 汉 一 样 的 代码 ,还 自我 感觉 良好 。 

(2) 写 代码 都 不 过 脑子 ,上 来 就 敲 , 还 吹 咕 自 己 一 天 写 了 多 少 行 , 写 得 再 多 ,也 只 是 造 了 
更 多 的 垃圾 。 

(3) 睹 设计 ,有 简单 的 方法 不 用 ,还 自 以 为 高 明 。 你 提醒 他 ,他 还 觉得 自己 有 个 性 。 

(4) 走路 都 没 走 稳 , 就 想 着 灵活 ,灵活 设计 是 给 小 白 的 吗 ? 不 是 , 那 是 给 高 手 出 招 的 ， 
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小 白 你 就 踏实 点 。 
(5) 高 手 是 有 牵 绊 ,有 顾虑 的 ,因为 被 坑 过 …… 度 的 拿捏 是 艺术 。 
刚 开 始 的 时 候 ,做 到 下 面 两 点 ,那么 你 的 程序 ,在 你 的 能 力 范围 内 应 该 就 是 好 的 。 


1. 编写 程序 前 ,， 一定 要 深思 熟 虑 


既然 编程 就 是 解决 问题 的 过 程 ,只 要 开始 编程 ,就 意味 着 你 要 从 细节 开始 设计 ,要 考虑 
如 何 更 好 地 解决 问题 ,最 终 的 程序 是 以 一 种 最 便捷 的 方式 呈现 出 解决 问题 的 思路 。 这 就 意 
味 着 ,开始 编程 之 前 就 要 进行 续 密 的 思考 。 有 太 多 人 (不 只 是 新 手 ) 拿 到 项 目 或 者 要 解决 的 
问题 ,马上 就 开始 编写 程序 。 这 种 做 法 ,经 常会 因为 考虑 不 周 , 导 致 代码 混乱 ,甚至 中 途 推 
翻 重 来 。 

所 以 ,开始 又 代码 之 前 ,首先 要 做 的 就 是 坐 下 来 ,认真 仔细 地 思考 一 下 ,怎样 能 更 好 地 
解决 问题 , 找 出 最 佳 方案 ,再 开始 实施 。 


2. 程序 要 有 好 的 可 读 性 


在 深思 熟 虑 的 基础 上 写 的 代码 就 是 好 代码 吗 ? 很 多 时 候 , 问 一 个 程序 员 , 你 的 程序 怎 
么 样 ? 他 可 能 会 回答 你 ,能 运行 。 能 运行 可 能 包含 以 下 两 个 方面 的 意思 。 

(1) 程序 能 够 解决 问题 ,并 且 本 身 没 问 题 。 但 这 是 好 程序 吗 ? 其 实 ,能 运行 是 最 低 标 
准 , 是 不 是 好 程序 还 要 看 代码 。 通 常 程序 员 写 代码 都 不 是 只 给 自己 看 的 ,既然 是 要 给 别人 
读 ,那么 ,代码 的 可 读 性 就 很 重要 ,可 以 想象 一 篇 没有 标点 、 没 有 断 句 的 文章 ,或 许 也 能 读 明 
白 , 但 它 肯定 不 是 好 文章 ,也 没什么 价值 。 

可 能 你 会 问 ,程序 能 运行 不 就 行 了 吗 ? 谁 没 事 总 看 ? 那 好 ,如 果 你 还 没有 开始 工作 , 那 
么 这 个 程序 可 能 就 是 自己 会 看 ,即便 这 样 ,自己 写 了 一 个 烂 程序 ,勉强 能 用 ,等 过 一 段 时 间 ， 
可 能 要 修改 一 些 功能 ,那么 要 做 的 第 一 件 事 就 是 先 读 懂 之 前 写 的 烂 代码 ,还 要 回想 当时 是 
怎么 想 的 。 

(2) 如 果 你 已 经 在 公司 工作 了 ,这 种 烂 代码 ,自己 看 起 来 都 费劲 ,你 能 想象 分 发 给 同事 
后 ,大 家 的 反应 吗 ? 相信 ,会 被 “弹劾 ”的 。 

所 以 ,经 过 深思 熟 虑 之 后 再 写 出 来 的 代码 一 定 不 会 吉 负 你 的 好 想法 ,否则 ,不 就 成 了 思 
想 上 的 巨人 ,行动 中 的 矮子 了 吗 ? 


为 什么 选择 Python 











我 开始 设计 一 种 语言 ， 使 得 程序 员 的 效率 更 高 . 
一 一 Guido van Rossum ( Python 之 父 ) [荷兰 ] 吉 多 … 范 罗 荔 姆 











编程 就 像 写 文章 ,那么 ,众多 语言 中 为 什么 选择 Python 呢 ? 试想 作为 一 门 陌生 的 、 面 
对 计算 机 的 语言 ,如 果 这 门 语言 更 接近 你 的 母语 ,而 且 写 起 来 跟 你 说 话 的 习惯 比较 类 似 , 那 
么 ,学 习 编 程 看 起 来 是 不 是 也 就 不 难 了 ? Python 恰好 就 是 这 样 一 门 比较 容易 掌握 的 语言 。 
当然 从 某 种 程度 来 看 Python 也 不 是 最 好 的 ,最 好 的 是 中 文 编程 或 者 方言 编程 ,哈哈 。 


分 
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Python 被 公认 为 是 最 适合 编程 人 门 的 语言 之 一 ,而 且 是 当下 最 流行 的 语言 之 一 , 早 在 
2007 年 和 2010 年 曾 两 次 获得 编程 语言 排名 的 第 一 名 ,IEEE Spectrum 2017 年 发 布 的 报告 
中 ,Python 再 度 排名 第 一 (图 0-1) 。Python 语言 特点 简单 概括 如 下 。 

(1) 语法 简单 ,容易 学 习 和 运用 。 

(2) 面向 对 象 编程 。 

(3) 路 平台 ,具有 可 移植 性 。 

(4) 模块 化 开发 ,功能 丰富 。 

(5) 具有 很 好 的 扩展 性 。 
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图 0-1 IEEE Spectrum 2017 年 发 布 的 报告 


Python 语言 的 语法 简洁 又 独特 ,很 短 的 时 间 内 就 可 以 写 出 一 些 看 起 来 或 实用 ,或 很 酷 
的 程序 ,这 在 后 面 的 学 习 中 会 深 有 体会 。 

面向 对 象 编程 最 大 的 好 处 就 是 让 程序 更 容易 维护 ,增加 了 代码 的 重复 利用 效率 。 深 入 
理解 面向 对 象 编程 是 程序 员 的 必修 课 。 

跨 平 台 的 意思 就 是 可 以 在 Windows、Linux、Mac 等 不 同 的 操作 系统 下 编写 并 运行 
Python 程序 。 这 样 ,在 一 个 系统 下 编写 的 程序 就 可 以 移动 到 其 他 系统 下 运行 ,这 就 是 移植 。 

Python 具有 非常 丰富 的 库 , 也 就 是 说 ,很 多 你 想 实 现 的 功能 ,其 实 都 已 经 有 人 写 了 ,你 
要 做 的 就 是 直接 拿 过 来 使 用 。 

扩展 性 是 指 Python 提供 了 扩展 接口 ,可 以 使 用 其 他 语言 为 Python 编写 扩展 功能 , 比 
如 C/C++。 当 然 ,Python 也 可 以 嵌入 其 他 语言 中 。 

有 这 么 多 的 好 处 ,Why Python? 有 答案 了 吧 ! 


Python 的 发 展 和 应 用 


Python 本 意 是 大 蟒蛇 ,但 其 实 来 历 并 没有 名 字 这 么 酷 。Python 的 创造 者 是 Guido 
van Rossum。 最 开始 的 时 候 ,Guido 开发 ABC 语言 ,圣诞 节 闲 着 无 聊 ,就 想 写 出 一 个 能 让 
非 编程 专业 的 计算 机 使 用 者 也 能 使 用 的 编程 语言 ,所 以 写 了 Python, 至 于 名 字 的 来 历 ,其 
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实 是 因为 Guido 是 一 个 英国 搞笑 团体 的 粉丝 ,这 个 被 称 为 搞笑 界 的 披 头 士 团体 叫 Monty 
Python 。 

由 于 Guido 开放 源码 ,以 至 于 Python 不 断 壮大 ,甚至 由 于 人 工 智能 和 数据 挖掘 等 领域 
的 大 量 应 用 , 变 成 了 网 红 语 言 。Python 从 发 布 至 今 经 过 了 一 系列 的 演变 ,我 们 来 看 一 下 主 
要 的 几 个 节点 。 

1989 年 ，Guido 开始 写 Python 语言 的 编译 器 。 他 希望 这 个 新 的 叫 作 Python 的 语言 ， 
能 符合 他 的 理想 : 是 一 种 C 和 shell 之 间 、 功 能 全 面 .易学 易 用 、 可 拓展 的 语言 。 

1991 年 ,第 一 个 Python 编译 器 诞生 。 它 是 用 C 语言 实现 的 ,并 能 够 调用 C 语言 的 库 文 
件 。 从 一 出 生 ,Python 已 经 具有 了 类 、 函 数 、 异 常 处 理 、 包 含 表 和 词典 在 内 的 核心 数据 类 型 
以 及 以 模块 为 基础 的 拓展 系统 。 

1994 年 ,Python 1.0: 1994 年 1 月 增加 了 lambda、map ,filter and reduce。 

2000 年 ,Python 2.0: 2000 年 10 月 ,加 入 了 内 存 回收 机 制 , 构 成 了 现在 的 Python 语言 
框架 基础 。 

Python 2.4: 2004 年 11 月, 目前 最 流行 的 Web 框架 Django 诞生 。 

2006 年 9 月 19 日 发 布 Python 2.5。 

2008 年 10 月 1 日 发 布 Python 2.6。 

2008 年 12 月 3 日 发 布 Python 3.0。 

2009 年 6 月 27 日 发 布 Python 3.1。 

2010 年 7 月 3 日 发 布 Python 2.7。 

2011 年 2 月 20 日 发 布 Python 3.2。 

2012 年 9 月 29 日 发 布 Python 3.3。 

2014 年 5 月 16 日 发 布 Python 3.4。 

2014 年 ,官方 发 表 声 明 , 对 Python 2.7 仅 支 持 到 2020 年 ,并 且 不 会 再 发 布 2.8 版 本 。 

2015 年 9 月 13 日 发 布 Python 3.5。 

2016 年 12 月 发 布 Python 3. 6。 

2018 年 6 月 发 布 Python 3.7。 

如 果 仔 细 看 上 面 的 节点 肯定 会 发 现 ,为 什么 2008 年 就 发 布 了 Python 3.0 版 本 ,而 2010 
年 又 发 布 了 Python 2.7 版 本 呢 ? 

这 是 因为 当时 Python 3. 0 发 布 时 ,就 不 再 支持 Python 2.0 的 版 本 ,导致 很 多 用 户 无 法 
正常 升级 使 用 新 版 本 ,而 当时 绝 大 部 分 项 目 都 是 Python 2.0 建立 的 ,所 以 后 来 又 发 布 了 一 
个 Python 2.7 的 过 渡 版 本 ,之 后 的 2014 年 声明 Python 2.7 只 会 支持 到 2020 年 ,所 以 新 手 
还 是 从 Python 3.0 人手 吧 。 不 过 ,作为 新 手 也 不 用 过 于 纠结 版 本 问题 ,因为 2.7 和 3.0 的 
差别 并 没有 达到 水 火 不 相 容 的 地 步 。 你 掌握 其 中 一 个 版 本 之 后 ,如 果 需 要 用 到 另 一 版 本 ， 
只 需要 花 一 点 时 间 就 能 快速 掌握 , 远 比 你 纠结 的 时 间 少 。 

Python 的 应 用 领域 非常 广泛 ,简直 就 是 万 能 的 。 经 常 有 人 会 问 :“ 老 师 ,Python 能 干 什 
么 ? 有 多 少 库 ? 我 都 要 学 吗 ?? 我 的 回答 一 般 是 :“Python 什么 都 能 干 ,但 是 你 得 看 你 要 干 
什么 ,或 者 对 哪 方面 感 兴趣 ,所 有 库 都 学 的 概念 就 好 像 在 学 字典 。” 
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下 面 这 几 个 方向 是 目前 Python 应 用 最 多 的 地 方 。 
。 云 计算 、 大 数据 : OpenStack、Hadoop。 
。 Web 开发 : Python 拥有 众多 优秀 的 Web 框架 ,比如 Django、Flask 等 。 许 多 大 型 网 
站 均 为 Python 开发 ,如 Youtube、Dropbox、 豆 办 等 。 
。 科学 运算 : NumPy、SciPy、Matplotlib .Enthought librarys pandas 。 
。 人 工 智能 : Scikits-learn、Tensorflow。 
。 系统 运 维 : 运 维 人 员 必 备 语言 ,自动 化 运 维 必 不 可 少 的 工具 。 
。 金融 : 量化 交易 ,金融 分 析 。 在 金融 工程 领域 ,Python 不 但 在 用 , 且 用 得 最 多 ,而 且 
重要 性 逐年 提高 。 主 要 原因 是 作为 动态 语言 的 Python, 语 言 结 构 清晰 简单 , 库 丰 
富 , 成 熟 稳定 ,科学 计算 和 统计 分 析 都 很 专业 ,生产 效率 远 远 高 于 C、C++、Java, 尤 其 
擅长 策略 回 测 。 
。 图 形 GUI: PyQT .wxPython、Tkinter。 
。 游戏 开发 : Pygame、pyglet、cocos2d-python。 
不 过 ,看 起 来 万 能 的 语言 , 倒 也 不 是 什么 都 用 Python 去 做 ,实际 情况 还 是 要 选择 适合 
的 语言 做 对 应 的 工作 。 比 如 Python 的 运行 速度 就 不 是 最 快 的 , 若 有 速度 要 求 ,用 C++ 改写 
关键 部 分 吧 。 不 过 对 于 用 户 而 言 ,机 器 上 的 运行 速度 是 可 以 忽略 的 ,用 户 几 乎 感觉 不 出 来 
这 种 速度 的 差异 。 


oo 


每 个 人 的 学 习 方 法 都 不 一 样 ,不 过 对 于 初学 者 ,我 有 一 些 建 议 ,希望 对 你 的 学 习 经 历 能 
起 到 一 些 帮 助 , 少 走 些 弯路 。 


1 保持 好 奇 心 





| 你 内 心 表 定 有 着 某 种 火焰 ， 能 把 你 和 其 他 入 区 别 开 来 。 本 


一 [南非 ] 约 输 马克 斯 市 尔 ， 库 切 《青春 》 

我 上 小 学 时 ,无意 间 看 到 一 本 中 学 的 物理 书 , 上 面 有 些 电路 图 ,有 些 就 是 电池 、 开 关 、 灯 
泡 的 串 并 联 ,虽然 不 明白 物理 的 专业 名 词 , 也 不 懂 原 理 , 但 看 着 图 觉得 很 好 玩 (图 0-2) , 读 了 
书 上 的 说 明 ,我 就 可 以 自己 按 书 上 的 例子 做 出 来 ,这 时 就 会 觉得 很 有 成 就 感 。 当 然 , 有 时 也 
会 有 危险 ,比如 有 一 次 接 了 一 个 电 铃 ,在 插头 插入 插座 的 一 瞬间 ,电线 整个 烧 糊 了 ,还 好 没 
有 电 到 我 。 

学 习 编 程 也 会 有 很 多 好 玩 的 东西 ,有 了 想法 就 试 着 去 做 ,细心 大 胆 地 试 ,编程 安全 得 
多 ,至 少 不 太 可 能 写 错 一 个 程序 就 让 你 的 计算 机 报废 。 

对 于 新 生 事物 ,我 们 总 是 心怀 好 奇 心 ,好 奇 心 也 是 能 够 让 你 轻松 投入 又 没有 负担 地 学 
习 的 原动力 。 
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图 0-2 启蒙 电路 图 


2. 不 要 感觉 枯燥 


有 人 觉得 学 了 编程 做 程序 员 ,工作 就 注定 很 枯燥 了 ,no no no…… 编 程 和 写作 一 样 ,都 
是 在 搞 创作 ,这 是 一 个 从 无 到 有 的 过 程 ,从 能 用 到 好 用 再 到 高 效 的 创作 过 程 。 编 程 是 门 艺 
术 ,程序 的 设计 和 度 的 拿捏 是 需要 功力 的 。 程 序 员 是 最 有 创造 力 的 一 个 群体 ,所 以 用 心 去 
感受 吧 。 


3. 做 笔记 , 但 是 不 要 抄 代码 


学 习 过 程 中 磁 到 新 的 知识 点 、 新 的 模块 新 的 技巧 ,可 以 多 做 学 习 笔 记 , 最 好 可 以 开 个 
博客 ,或 者 找 一 个 在 线 的 大 本 营 , 记 录 并 跟 更 多 人 分 享 你 的 学 习 过 程 和 经 验 , 跟 更 多 的 人 交 
流 总 是 可 以 获得 更 大 的 帮助 。 做 学 习 笔记 ,但 是 不 要 抄 代码 。 你 把 网 上 看 到 的 代码 复制 过 
来 放 到 自己 的 博客 或 者 空间 想 要 留 着 以 后 看 或 者 觉得 放 在 那儿 就 算 会 了 ,这 跟 抄 代码 一 
样 ,都 是 不 对 的 。 所 有 抄 代码 的 行为 一 点 益处 也 没有 ,最 好 的 办 法 是 自己 做 一 遍 , 再 把 自己 
的 代码 和 心得 保存 下 来 。 


4. 多 动手 , 不 要 只 是 看 


编程 不 是 做 阅读 理解 ,看 得 再 多 也 是 没 用 的 ,一 定 要 多 动手 实践 。 对 于 初学 者 、 小 白 、 
零 基础 ,更 是 如 此 。 再 简单 的 程序 也 要 动手 操作 一 下 ,不 动手 ,可 能 一 个 空格 ,一 个 符号 都 
是 陷阱 。 当 然 , 动 手 了 也 会 碰 到 各 种 陷阱 ,但 这 个 过 程 就 是 你 成 长 的 过 程 。 


5. 细心 一 点 ， 知 其 然 ， 知 其 所 以 然 


因为 有 太 多 次 类 似 的 经 历 ,不 得 不 说 一 下 。 经 常 有 人 会 拿 着 程序 来 找 我 问 :“ 邹 老师 ， 
你 看 我 的 程序 和 你 的 例子 一 样 ,怎么 结果 就 不 一 样 呢 ?”“ 怎 么 你 的 能 运行 ,我 的 就 报错 呢 ?” 
每 当 这 种 时 候 我 是 最 崩溃 的 ,我 的 第 一 个 问题 都 是 :“ 一 样 吗 ? 你 再 看 看 ,你 确定 一 样 吗 ?” 
往往 这 时 自己 检查 后 就 会 发 现 问题 所 在 。 其 实 类 似 的 问题 ,马虎 只 是 一 个 方面 ,最 主要 是 
因为 当 你 在 照 着 别人 的 代码 敲 时 ,要 么 根本 不 理解 在 做 什么 ,只 是 机 械 地 一 个 一 个 跟着 敲 ， 
最 后 可 能 差 个 空格 ,多 个 符号 等 ;要 么 是 运行 环境 根本 不 对 ,比如 需要 的 库 没 有 安装 ,环境 
本 身 有 问题 等 。 所 以 ,细心 一 点 ,重要 的 是 知 其 然 更 要 知 其 所 以 然 。 
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6. 多 寻求 互联 网 的 帮助 


互联 网 如 此 发 达 的 今天 ,你 碰 到 的 问题 可 能 别人 早 就 遇 到 过 ,已 经 提供 了 解决 办 法 。 
那么 ,有 问题 时 多 到 网 络 上 跟 大 家 交流 是 个 不 错 的 办 法 ,比如 各 种 技术 论坛 .问答 组 、 交 
流 群 。 但 是 ,这 种 求助 不 包括 代码 写 不 出 来 去 网 上 求 代码 ,这 跟 上 学 抄 作业 一 样 ,坚决 
不 能 。 


7. 提问 的 艺术 


说 到 了 寻求 帮助 ,在 学 习 过 程 中 碰 到 问题 是 再 正常 不 过 了 ,不 论 初学 者 还 是 高 手 都 会 
遇 到 问题 。 但 是 ,大 家 寻求 帮助 的 方法 却 有 很 多 错误 。Eric Raymond 2001 年 发 表 的 《提问 
的 艺术 : 如 何 快速 获得 答案 ) 一 文 ,通过 对 好 问题 和 坏 问 题 的 比较 ,结合 自己 的 经 验 ,对 如 何 
能 在 互联 网 快速 获取 到 帮助 ,做 了 详细 的 阐述 。 和 希望 读者 朋友 有 时 间 一 定 看 一 看 。 这 里 我 
简单 地 说 几 点 。 

(1) 作为 能 回答 问题 的 高 手 , 只 喜欢 值得 思考 的 问题 ,相对 来 说 ,有 些 问题 本 身 就 是 垃 
圾 ,不 动脑 筋 的 人 是 不 会 得 到 帮助 的 。 所 以 ,在 提问 之 前 ,首先 尝试 自己 找 答案 ,手册 、 文 
献 \ 图 书 、 搜 索引 擎 等 都 是 你 的 工具 。 

(2) 提出 问题 时 ,有 偿 提 问 或 免费 社区 都 可 以 选择 。 首 先 要 说 明 在 此 之 前 你 干 了 些 什 
么 ,这 样 能 证 明 你 不 是 一 个 想 不 劳 而 获 的 伸手 党 。 问 题 的 语法 要 正确 ,用 词 要 准确 ,因为 没 
人 愿意 回答 明显 有 错别字 或 关键 字 的 代码 ,比如 for 写成 了 fro 等 。 问 题 描述 准确 但 不 哆 
唆 ,描述 不 清 就 提供 代码 或 者 截图 。 

(3) 别 问 本 该 自己 解决 的 问题 , 那 是 你 自己 学 习 的 过 程 , 不 是 别人 的 义务 ;去 除 无 意义 
的 问题 , 别 问 1 加 1 为 什么 等 于 2; 懂 得 感恩 ,无 论 提问 前 还 是 得 到 答案 后 。 


CI 多 平台 搭建 Python 开发 环境 


“ 工 欲 善 其 事 , 必 先 利 其 器 。? 学 习 编 程 首先 需要 具备 编程 的 环境 ， 
并 且 能 够 确切 地 知道 编程 环境 的 作用 ,因为 这 个 环境 不 是 指 鸟 语 花香 
的 书房 。 我 们 需要 做 的 准备 工作 如 下 。 





(1) 一 颗 好 奇 的 心 。 
(2) 一 台 能 上 网 的 计算 机 。 国 训 过 
下 面 我 们 就 带 着 好 奇 心 开启 编程 之 旅 吧 。 拱 建 Python 环境 


0.6.1 什么 是 开发 环境 


我 第 一 次 接触 编程 语言 时 什么 都 不 懂 , 确 切 地 说 , 那 时 候 是 在 电视 上 看 到 的 “C 语言 
学 ”课程 ,正好 那 节 课 讲 的 是 用 “x* ”在 屏幕 上 排列 出 一 个 五 角 星 。 出 于 好 奇 心 ,对 于 一 个 在 
大 多 数 家 庭 还 没有 计算 机 的 年 代 , 如 果 会 这 件 事 ,我 觉得 非常 酷 。 于 是 我 很 认真 地 记 下 了 
过 程 和 代码 ,之 后 ,我 把 那 段 代码 背 得 烂熟 于 心 ,希望 有 一 天 可 以 在 人 前 炫耀 。 

当 终于 有 了 一 个 机 会 可 以 在 计算 机 上 毅 代 码 时 ,我 迫不及待 地 把 背 下 来 的 代码 演示 给 
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同学 看 。 但 是 , 却 以 失败 告终 ,至 于 原因 ,我 当时 的 解释 是 ,学 校 的 计算 机 太 垃圾 ,哈哈 。 

直到 后 来 电视 重播 了 那 套 “C 语言 教学 ?课程 ,我 才 知道 ,第 一 课 讲 的 不 是 代码 ,而 是 开 
发 环境 , 教 的 是 搭建 C 语言 开发 环境 。 回 想 我 之 前 编程 的 环境 ,仅仅 是 在 记事 本 里 输入 了 
我 的 代码 ,哪里 有 什么 环境 。 

那么 ,什么 是 开发 环境 呢 ? 简单 来 说 ,就 是 计算 机 中 的 一 个 “翻译 ”, 它 能 把 你 写 的 程序 
解释 给 计算 机 去 执行 ,还 能 够 把 计算 机 执行 的 结果 翻译 成 你 能 懂 的 信息 返回 给 你 。 

Python 最 基本 的 开发 环境 就 是 在 计算 机 上 安装 一 个 叫 Python 的 软件 ,这 样 在 Python 
软件 提供 的 环境 里 执行 Python 指令 时 ,计算 机 就 能 明白 你 要 做 什么 了 。 


062 ”获得 Python 安装 包 


登录 Python 的 官方 网 站 www. python. org 即 可 获取 Python 安装 包 。 第 一 次 接触 到 
这 个 网 站 的 顺便 认识 一 下 吧 ,这 里 不 仅 可 以 下 载 软件 ,也 是 Python 编程 过 程 中 获得 第 一 手 
信息 的 地 方 , 这 里 不 仅 有 Python 软件 包 , 还 有 Python 的 详细 使 用 手册 和 Python 的 模块 仓 
库 , 除 了 安装 Python 时 自 带 的 模块 以 外 ,这 里 还 有 很 多 第 三 方 开发 的 模块 。 

先 来 找 Python 的 安装 包 。 打 开 www. python. org (图 0-3) 网 站 , 单 击 主页 中 的 
Download 按钮 ,找到 合适 的 版 本 下 载 即 可 。 找 到 软件 包 时 ,你 会 看 到 很 多 版 本 ,有 针对 不 
同系 统 的 ,也 有 同一 个 系统 的 不 同 版 本 ,首先 根据 你 的 操作 系统 选择 对 应 版 本 ,然后 会 发 现 
有 Python 2. * 和 Python 3. * ,在 本 书 中 ,我 们 采用 Python 3. 6. 2 进行 演示 ,这 并 不 是 说 
Python 2. * 就 是 旧 的 ` 已 经 淘汰 的 版 本 ,恰恰 在 这 本 书 创作 时 ,Python 2 还 是 国内 很 多 网 站 
的 主流 ,这 是 有 历史 原因 的 。 




















() Get Started Download 


图 0-3 www. python. org 网 站 


作为 Python 程序 员 经 常会 自 黑 Python 2 和 Python 3 这 两 门 语言 ,实际 并 没有 那么 严 
重 。 虽 然 有 些 区 别 ,但 在 初学 阶段 不 需要 太 纠 结 ( 后 面 会 涉及 一 些 比较 明显 的 差异 ) 。 
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0.6.3 安装 Python 
注意 : 不 要 在 一 个 系统 上 同时 安装 Python 2 和 Python 3 ,除非 你 清楚 地 知道 怎么 区 分 


它们 。 
下 载 完成 后 就 可 以 开始 安装 了 。 在 Windows、Mac 和 Linux 系统 下 的 安装 过 程 如 下 。 
1) 在 Windows 系统 下 安装 
开始 运行 安装 程序 后 ,本 书 没有 图 示 的 步骤 ,只 要 单 击 “ 下 一 步 ” 按 钮 即 可 ,到 图 0-4 所 
示 这 一 步 时 需要 注意 , 粗 箭头 所 指 的 Add Python 3.6 to PATH, 需 要 勾 选 上 ,如 果 没 勾 选 ， 
安装 之 后 会 导致 无 法 运行 Python。 
tn Python 3.6.2 (32-bit) Setup 
Install Python 3.6.2 (32-bit) 
Select Install Now to install Python with default settings, or choose 


Customize to enable or disable features. 


四 Install Now 
C\Users\miloAppData\Local\Programs\Python\Python36-. 


全 Customize installation 
Choose location and features 


回 Install launcher for all users (recommended) 


python 
for 
windows EU Python 3.6 to PATH 

















0-4 安装 选项 设置 


另外 ,关于 Customize installation ,你 可 以 打开 看 看 ( 见 图 0-5) ,作为 定制 部 分 ,一 般 默 
认 即 可 。 在 没 搞 清楚 都 是 什么 功能 时 ,建议 全 部 安装 ,其 中 有 个 pip, 在 本 章 我 们 就 会 用 到 。 
看 到 图 0-6 就 说 明 安装 成 功 了 。 





岂 Python 3.6.2 (32-bit) Setup = x 


Optional Features 


[lv| Documentation 








Installs the Python documentation file. 


Mpip 
Installs pip, which can download and install other Python packages. 
回 tdhnk and IDLE 


Installs tkinter and the IDLE development environment. 























[| Python test suite 
er Installs the standard library test suite. 





回 py launcher [for al users (requires elevation) 
Use Programs and Features to remove the 'py launcher. 


python 
windows Ee | Eo 


图 0-5 定制 功能 界面 
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名 Python 3.6.2 (32-bit) Setup = Se 
Setup was successful 


Special thanks to Mark Hammond, without whose years of 
freely shared Windows expertise, Python for Windows would 


still be Python for DOS. 
New to Python? Start with the online tutorial and 
| doaumentation. 


See what's new in this release. 
python 
i for 
windows | 








图 0-6 安装 成 功 


2) 在 Mac 系统 下 安装 

在 Mac 系统 下 安装 要 简单 得 多 ,只 要 按 提 示 单 击 “ 下 一 步 ” 按 钮 即 可 ,此 处 省 略图 示 讲 解 。 

3) 在 Linux 系统 下 安装 

若 你 是 Linux 系统 ,恭喜 你 ,大 部 分 主流 Linux 都 自 带 了 Python 2, 有 的 发 行 版 已 经 自 
带 了 Python 3, 采 用 默认 版 本 即 可 。 


命令 行 模式 及 Python 的 第 一 次 运行 


软件 安装 好 之 后 ,就 可 以 检验 一 下 成 果 了 。 由 于 Python 是 跨 平 台 的 ,分 别 在 不 同 的 系 
统 中 安装 了 Python ,就 好 像 在 iPhone 和 安 卓 上 安装 了 同一 款 软件 一 样 。 手 机 系统 不 一 样 ， 
但 软件 一 样 ,其 使 用 也 是 一 样 的 ,所 以 不 同 平台 Python 开发 的 过 程 是 一 样 的 ,只 是 有 些 外 
在 形式 可 能 存在 差异 。 

运行 Python 之 前 ,你 要 明确 一 点 ,在 计算 机 中 ,除了 熟悉 的 图 形 界面 外 ,还 可 以 通过 字 
符 界面 控制 计算 机 ,也 就 是 命令 行 模式 。 是 的 ,就 像 黑客 电影 一 样 。 你 不 要 以 为 既然 有 了 
Windows 图 形 化 的 窗口 系统 , 谁 还 用 字符 界面 。 其 实 ,作为 程序 员 ,非常 有 必要 了 解 命令 行 
模式 ,不 用 多 ,基本 的 操作 暂时 就 够 了 。 因 为 命令 行 模式 相对 于 图 形 更 直接 .更 纯粹 ,相对 
来 说 工作 效率 更 高 。 

(1) 先 来 看 一 下 Windows 用 户 吧 。 一 般 情况 下 , Windows 用 户 对 字符 界面 会 比较 陌 
生 , 作 为 第 一 次 运行 ,你 可 以 用 最 经 典 的 cmd( 命 令 提示 符 )。 以 Windows 10 为 例 ,你 可 以 
直接 搜索 cmd( 见 图 0-7) 就 能 找到 了 ,运行 界面 如 图 0-8 所 示 。Windows 中 还 有 一 种 更 强大 
的 命令 模式 ,就 是 PowerShell, 你 也 可 以 直接 搜索 使 用 ( 见 图 0-9)。 基 本 使 用 方法 是 一 样 
的 ,只 是 PowerShell 支持 更 多 的 命令 ,样子 看 起 来 也 比 cmd 高 级 了 许多 ,并 且 可 以 自己 进 
行 一 些 配 置 调 整 。 建 议 调整 为 黑 背 景 白字 。Windows 用 户 推荐 使 用 PowerShell, 具 体 运行 


界面 如 图 0-10 所 示 。 
(13 》 
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cmd 


fC Dh 





图 0-7 搜索 启动 cmd 


征 选 器 \/ 








国 市 全 元 条 
Microsoft Windowe [版 本 19.9.19586] 
(ce) 2915 Nierosoft Corporation， 保 包 


IC:\Users\milo> 


图 0-8 cmd 运行 界面 


男 口 ®@ 
最 佳 匹配 


加 Windows PowerShell 
桌面 应 用 


应 用 > 


搜索 建议 > 
只 powershell 


powershell 








加 Windows PowerShell (x86) 
司 Windows PowerShell ISE 


于 Windows PowerShell ISE (x86) 








诗 选 中 、/ 





0-9 搜索 启动 PowerShell 
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Windows PowerShell 一 口 x 
Windows PowerShell ~ 
版 权 所 有 《C) 2015 Microsoft Corporation。 保 留 所 有 权利 。 图 | 
Fs C:\Users\milo> 

~ 
Ms = > 





图 0-10 ”PowerShell 运行 界面 


(2) Mac 用 户 也 一 样 ,再 炫 的 图 形 界面 也 不 如 字符 终端 实在 。Mac 用 户 只 需要 打开 
terminal( 见 图 0-11) 终 端 即 可 ,terminal 原始 位 置 是 fnder-> 工 具 栏 一 应 用 程序 一 实用 工具 一 
终端 。 


eae tmp— -bash — 80x24 
mypro:tmp milo$l 











图 0-11 terminal 


(3) 至 于 Linux 用 户 ,我 想 说 如 果 你 是 Linux 用 户 难道 还 需要 看 我 介绍 吗 ? 作为 一 个 
Linux 忠实 粉丝 ,直接 启动 终端 吧 ( 见 图 0-12) 。 
以 上 就 是 用 户 群体 最 多 的 三 个 操作 系统 关于 字符 终端 的 启动 方式 ,这 时 候 你 可 以 执行 
一 些 系 统 命令 。 输 入 命令 ,然后 按 Enter 键 执行 。 
以 Windows 为 例 , 你 可 以 看 一 下 自己 现在 处 于 系统 的 什么 位 置 ( 见 图 0-13) ,你 当前 所 
在 目录 下 有 哪些 文件 ( 见 图 0-14 和 图 0-15) 。 
A 
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国 =Legent 


[vagrant@localhost ~]$ 








图 0-12 shell 





就 是 
我 


nl 


注 方 
你 现在 nt 置 的 意思 是 ， 


在 在 0 大 SerS 文 { 的 mi1o 文 件 夹 


一 般 我 们 会 说 成 我 现在 所 在 路 径 为 
Users 目 录 下 的 milo 目 录 


目录 指 的 就 是 文件 夹 











0-13 显示 当前 所 在 路 径 





如 果 屏 幕 显示 满 了 ,可 以 执行 清 屏 指令 clear 或 者 按 Ctrl 十 L 组 合 键 (Windows 的 cmd 
不 支持 ,PowerShell 可 以 ) 。 

适应 了 命令 行 模式 后 (这 时 你 所 输入 的 命令 都 是 直接 下 达 给 计算 机 的 ) , 接 下 来 我 们 进 
入 Python 语言 的 环境 下 执行 Python 指令 。 直 接 在 字符 终端 输入 python, 回 车 即 可 看 到 如 
图 0-16 所 示 界 面 , 明 显 的 标志 是 有 "之 之 >” 的 提示 符 。 看 到 这 样 的 界面 ,就 表示 已 经 在 
Python 语言 环境 中 了 ,你 可 以 输入 第 一 个 Python 指令 (确切 地 说 是 执行 Python 的 print() 
方法 ) 在 屏幕 上 输出 你 的 名 字 ( 见 图 0-16) 。 


fo 
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nt 


， 向 屏幕 办 出 3 


rn 


号 中 的 内 容 











图 0-16 ”Python 交互 环境 
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注意 : 此 时 需要 明确 的 是 ,你 是 在 系统 环境 中 还 是 在 Python 环境 中 ,因为 在 系统 环境 
中 只 能 执行 系统 命令 ,不 能 执行 Python 指令 。 同 样 ,在 Python 环境 下 也 不 能 直接 执行 系 
统 命令 。 接 下 来 的 课程 中 有 些 指令 是 系统 命令 而 不 是 Python 的 指令 ,需要 进行 区 分 。 

最 后 ,我 们 执行 完 Python 指令 ,可 以 执行 exit() 指 令 退 出 Python 环境 ( 见 图 0-17) ,这 
就 好 像 你 在 系统 中 玩 完 游戏 退出 , 回 到 系统 是 一 样 的 。 








图 0-17 exit() 


到 此 ,就 完成 了 与 Python 的 第 一 次 对 话 ,我 们 下 达 了 在 屏幕 输出 自己 名 字 的 指令 ， 
Python 解释 给 计算 机 之 后 ,在 屏幕 上 打印 出 了 指定 的 内 容 。 

本 书 的 课程 基于 Windows 系统 进行 讲解 ,因为 Python 本 身 支持 跨 平台 ,所 以 ,实际 上 
在 哪个 系统 上 操作 都 是 一 样 的 ,因为 都 是 在 Python 环境 下 开发 ,用 什么 系统 主要 取决 于 你 
要 做 什么 事 。 


| 虹 重点 提示 


在 这 一 章 中 ,你 要 掌握 的 内 容 : 

(1) 意识 上 跨 过 编程 的 门槛 。 

(2) 能 顺利 搭建 Python 环境 ,注意 PATH。 

(3) 熟悉 系统 的 命令 行 模式 ,了 解 基本 操作 。 

(4) 熟悉 Python 的 交互 模式 ,并 在 交互 模式 下 执行 Python 指令 。 
3 动 动手 

(1) 浏览 Python 官网 https://www. python. org, 下 载 跟 自己 系统 对 应 版 本 的 安装 包 ， 
找到 对 应 版 本 的 Python 文档 并 且 浏 览 。 

(2) 搭建 Python 环境 并 测试 。 

(3) 在 系统 中 创建 一 个 用 来 保存 代码 的 文件 夹 My Python Code。 

(4) 在 命令 行 模式 下 找到 并 进入 My Python Code 文件 夹 。 

(5) 在 Python 解释 器 中 执行 print() 输 出 一 些 个 人 信息 ,比如 身高 、 体 重 等 。 

(6) 在 解释 器 中 直接 做 一 些 数 学 运算 ,比如 1 十 1、3 一 2、5X6、10/2。 

(7) 计算 个 人 的 BMI( 即 身体 质量 指数 ) ,其 值 为 体重 (kg)/[ 身 高 (m) 了 ,成 人 正常 范围 
是 18. 5 一 23. 9, 低 则 疲 , 高 则 胖 。 
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上 一 章 , 我 们 已 经 搭建 好 了 开发 环境 , 接 下 来 是 否 该 学 习 程序 最 基本 的 组 成 元 素 和 语 
法 结构 了 呢 ? 作为 一 本 骨骼 清 奇 的 编程 书 , 怎 么 能 这 么 俗套 呢 ? 有 了 编程 环境 ,我 们 现在 
就 开始 编程 吧 ,老师 都 是 看 了 一 节 电视 教学 就 编 五 角 星 程序 ,你 也 来 编程 吧 , 别 等 着 我 罗列 
知识 点 了 , 干 活 吧 ! 

从 需求 出 发 ,把 想法 变 成 代码 ,熟悉 并 遵循 编码 规范 ,这 就 是 编程 
的 三 要 素 (我 定义 的 ) 。 掌 握 这 三 个 要 素 ,就 算 和 人 门 了 ,后 面 的 学 习 , 无 
非 就 是 ， 

(1) 根据 不 同 的 需求 ,分 析出 解决 办 法 。 

(2) 学 习 各 种 语法 以 便 支撑 你 的 想法 变 成 程序 。 

(3) 编写 代码 时 遵循 通用 规则 。 


第 一 个 程序 的 诞生 


现在 你 已 经 了 解 了 字符 终端 和 Python 的 运行 环境 ,就 已 经 算是 有 两 把 刷子 了 ,我 们 就 
来 编程 吧 。 不 要 顾虑 太 多 ,开始 编程 只 需要 一 个 理由 ,就 是 我 要 做 什么 ,现在 要 做 的 就 是 画 
一 个 五 角 星 。 


111 编程 动机 


编程 之 前 先 不 要 急 着 考虑 程序 怎么 写 ,回想 一 下 前 面 讲 的 , 写 文章 之 前 ,首先 是 有 一 个 
想法 ,然后 再 找 合适 的 文字 把 它 变 成 文章 。 编 程 也 一 样 ,如 果 我 们 的 目标 是 要 画 一 个 五 角 
星 ,那么 你 首先 想到 的 是 什么 ? 是 还 不 了 解 语法 的 程序 代码 ? 还 是 程序 运行 的 效率 ?都 不 
是 ,应 该 是 脑子 里 的 五 角 星 的 形状 ,如 果 在 纸 上 画 ,起 笔顺 序 应 该 也 想 好 了 吧 ! 

把 在 纸 上 画 五 角 星 这 个 过 程 变 成 程序 ,让 计算 机 来 画 , 画 出 第 一 个 ,就 可 以 画 出 满 天 繁 
星 , 这 就 是 你 的 编程 动机 。 不 管 是 谁 , 能 用 最 简单 便捷 的 方法 实现 自己 的 想法 ,就 是 好 
程序 。 


112 神奇 的 导入 : import 


只 靠 脑 子 想 没有 用 ,因为 现在 还 是 小 白 ,脑子 里 没 东西 ,所 以 ,有 了 想法 之 后 ,就 要 通过 
编程 语言 把 想法 变 成 程序 ,这 时 就 要 充电 学 习 了 。 
前 面 我 们 提 到 Python 中 有 很 多 模块 (也 可 以 叫 库 ) ,它们 可 以 做 很 多 事 , 现 在 我 们 想 画 
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图 , 那 就 找 一 个 能 画图 的 库 , 这 比 生 涩 的 语法 要 容易 得 多 ,其 至 不 需要 明白 关键 代码 怎么 
写 。 这 些 库 通 常 都 有 帮助 文档 或 手册 ,只 是 拿 来 按说 明 使 用 就 可 以 了 。 在 Python 中 使 用 
这 些 模 块 的 第 一 步 就 是 通过 import 指令 导入 模块 ,语法 如 下 : 





>>> import 模块 / 库 名 字 
先 来 试 着 导入 第 一 个 : 


>>>import this 





我 们 并 没有 使 用 print() 向 屏幕 输出 ,但 是 我 们 看 到 了 一 段 话 ( 见 图 1-1) ,这 段 话 就 是 由 
模块 this 实现 的 效果 ,内 容 是 著名 的 Python 武功 心 法 一 一 Python 之 禅 。 它 是 Python 程 
序 设计 的 哲学 。 如 果 时 间 允 许 , 建 议 逐 条 看 一 看 ,学 习 过 一 段 时 间 之 后 再 回来 看 这 段 话 会 
有 更 深 的 体会 。 














图 1-1 Python 之 禅 












Python 之 禅 by Tim Peters 加 
优美 胜 于 五 项 (Python 以 编写 优美 前 代码 为 目标 ) 。 
明了 胜 于 临 汲 (优美 前 代码 应 当 是 明了 前 ， 命 名 规范 ， 风 格 相 似 ) 。 
简洁 胜 于 复 条 (优美 前 代码 应 当 是 简洁 前 ， 不 要 有 复 条 前 内 部 实现 ) 。 
复 帮 胜 于 凌乱 (如果 复 条 不 可 车 免 ， 那 代码 间 也 不 能 有 难 懂 的 关系 ， 要 保持 扶 口 简洁 ) 。 
扁平 胜 于 赃 套 ( 优美 前 代码 应 当 是 扁平 的 ， 不 能 有 太 允 的 该 套 ) 。 
间隔 胜 于 紧凑 (优美 的 代码 有 话 当 的 间隔 ， 不 要 奢望 一 行 代码 解决 问题 ) 。 
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月 。 可 读 性 很 重要 ( 优美 的 代码 量 可 读 的 ) 。 e 

即便 假借 特例 的 实用 福 之 和 名， 也 不 可 告 背 议 些 规 则 ( 议 些 规则 至 高 无 上 ) 

不 要 包容 所 有 错误 ， 除 非 你 确定 需要 这 祥 做 (精准 地 捕获 异常 ， 不 写 except; pass 风 
将 的 代码 ) 。 

当 存在 多 种 可 能 ， 不 要 尝试 去 猜测 . 

而 是 尽量 找 一 种 ， 最 好 是 唯一 一 种 明显 前 解决 方案 ( 如 果 不 确定 ， 就 用 帘 举 洁 ) 

虽然 这 并 不 套 易 ， 因 为 你 不 是 Python 之 父 (这 里 的 Dutch 是 指 Guido ) 。 

做 也 许 好 证 不 做 ， 但 不 假 思索 就 动手 证 不 如 不 做 ( 动手 之 前 要 细 思 量 ) 

如 果 你 无 法 向 入 措 迹 你 前 方案 ， 隶 肯定 不 是 一 个 好 方案 ; 反之 亦 然 (方案 测评 标准 ) 。 
| 命名 空间 旺 一 种 绝妙 的 理念， 我 们 应 当 多 加 利用 ( 倡导 与 号 召 ) . 加 














好 了 ,可 能 在 屏幕 上 看 到 一 段 话 并 没有 多 神奇 ,那么 ,你 在 计算 机 联网 的 前 提 下 试 着 执 
行 下 面 这 条 指令 : 


>>> import antigravity 


怎么 样 ? 你 只 是 执行 了 一 条 指令 ,计算 机 就 自动 打开 了 浏览 器 ,并 且 访 问 到 一 个 网 站 ， 
看 到 了 这 幅 漫 画 ( 见 图 1-2) 。 就 像 漫 画 上 说 的 一 切 都 是 这 么 简单 。 





1-2 ”import antigravity 效果 图 


11.3 ” 画 一 个 五 角 星 


知道 了 Python 有 很 多 神奇 的 模块 ,我们 就 可 以 开始 画图 了 。 这 里 要 用 到 一 个 叫 turtle 
的 模块 ,这 个 模块 用 起 来 就 像 它 的 名 字 一 样 ,我 们 控制 一 只 小 海龟 在 沙滩 上 扑 行 ,通过 指挥 
它 的 运动 轨迹 来 画图 。 想 一 下 画 五 角 星 运 笔 的 顺序 ,每 条 边 多 长 ,每 个 角 多 少 度 。 我 的 想 
法 是 先 画 一 条 直线 ,然后 转 144 ,再 画 一 条 直线 ,再 转 144”, 直 到 把 整个 五 角 星 画 完 。 

想法 确定 后 就 可 以 开始 了 ,首先 需要 导入 turtle 模块 : 


>>>import turtle 


这 时 你 还 看 不 到 任何 效果 , 接 下 来 开始 学 习 指 挥 它 。 通 常 模 块 中 会 提供 很 多 方法 ,这 
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里 我 们 指挥 turtle 画 五 角 星 只 需要 两 个 方法 : 画 直 线 和 转向 。 直 线 方 法 是 forward() ,转向 
方法 是 right() 或 left() 。 调 用 方法 是 点 记 法 ,比如 ,直行 就 写作 turtle. forward(200) ,点 记 
法 在 这 里 就 是 用 来 表明 调用 turtle 里 面 的 forward 方法 。 括 号 中 的 数字 代表 前 进 的 距离 ， 
单位 是 像素 (像素 就 是 屏幕 显示 的 最 小 的 点 ) ,这 条 指令 的 意思 就 是 直行 200 像素 。 而 转向 
写作 turtle. right(144) ,括号 中 的 数学 是 转向 的 角度 。 我 们 一 条 一 条 地 下 达 指 令 让 Python 
去 解释 执行 ,你 会 看 到 每 条 命令 的 效果 ( 见 图 1-3) 。 

【五 角 星 指令 】 


>>>import turtle 
>>>turtle.forward(200) 
>>>turtle.right (144) 
>>>turtle.forward (200) 
>>>turtle.right (144) 
>>>turtle.forward (200) 
>>>turtle.right (144) 
>>>turtle.forward (200) 
>>>turtle.right (144) 
>>>turtle.forward (200) 
>>>turtle.right (144) 





1 Python Turde Graphics Oh 














1-3 ”turtle 画 的 五 角 星 


注意 : 随 着 学 习 的 深入 ,指令 会 逐渐 增加 ,也 会 越 来 越 复杂 ,建议 在 对 不 熟悉 的 新 功能 
进行 测试 或 者 出 问题 进行 第 查 时 ,逐条 执行 ,这 是 测试 的 一 种 方法 ,能 够 方便 你 找 出 问题 所 
在 ,也 是 交互 模式 的 意义 所 在 。 
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绘制 五 角 星 的 过 程 就 是 一 次 交互 式 会 话 , 我 们 下 达 一 条 指令 ,计算 机 回馈 一 个 执行 效 
果 。 这 是 因为 Python 是 解释 型 语言 ,这 个 特征 使 学 习 和 试 错 更 方便 (所 谓 的 解释 型 就 是 程 
序 在 执行 过 程 中 ,会 通过 Python 解释 器 每 次 读 取 一 行 Python 代码 并 逐 行 解释 )。 这 意味 


© 








第 1 章 开始 编程 








着 ,我 们 可 以 在 学 习 或 者 尝试 新 功能 时 , 先 在 PythonShell 环境 中 实验 代码 ,可 以 很 快 ,很 直 
观 地 看 到 效果 ,成 功 或 者 失败 。 这 个 功能 非常 有 用 ,这 也 使 Python 更 易于 探讨 和 学 习 。 我 
极力 建议 在 学 习 新 功能 时 , 先 通过 交互 式 会 话 进行 测试 。 


115 编写 程序 


现在 ,你 已 经 可 以 通过 Python 对 计算 机 下 达 指 令 了 ,但 是 看 起 来 这 还 不 像 程 序 。 那 什 
么 是 程序 呢 ? 程序 就 是 指令 的 集合 。 把 你 的 指令 保存 到 一 个 文件 里 ,这 个 文件 就 是 程序 ， 
编程 其 实 就 是 在 编 这 个 文件 里 的 内 容 。 所 以 ,现在 要 做 的 就 是 把 能 画 出 五 角 星 的 所 有 指 
令 ,按照 每 行 一 条 的 形式 保存 到 一 个 文件 里 ,作为 Python 程序 ,这 个 文件 的 后 级 名 必须 是 
.py, 然 后 文件 命名 尽量 简单 、 易 懂 , wujiaoxing. py 就 不 错 。 若 无 必要 ,不 要 用 中 文 , 也 不 要 
用 有 特殊 意义 的 名 字 , 比 如 这 个 画图 程序 会 用 到 turtle, 所 以 这 个 文件 的 名 字 就 不 要 用 
turtle. py。 这 点 很 重要 ,后 面 学 习 到 新 内 容 时 也 一 样 , 至 于 原因 ,等 学 到 模块 就 会 明白 了 。 你 
也 可 以 现在 穿越 到 模块 看 一 下 。 练 习 时 如 果实 在 没有 好 名 字 ,你 也 可 以 命名 为 turtle01. py。 

“保存 到 文件 ?方法 最 直接 的 就 是 用 记事 本 。 不 过 ,Python 环境 提供 了 一 个 更 方便 开发 
Python 程序 的 基本 IDE( 集 成 开发 环境 ) , 叫 作 IDLE。 你 可 以 在 Python 的 安装 目录 中 找 
到 ,也 可 以 直接 搜索 运行 IDLE( 见 图 1-4) 启 动 PythonShell( 见 图 1-5)，PythonShell 是 
IDLE 提供 的 一 个 交互 界面 ,打开 之 后 所 处 的 环境 跟 在 命令 行 下 执行 了 Python 之 后 所 进入 
的 Python 环境 一 样 ,你 可 以 直接 执行 Python 指令 但 不 能 执行 系统 命令 ,要 跟 PowerShell 
区 分 开 。 在 这 里 你 还 可 以 直接 开始 编辑 一 个 文件 ,并且 运行 程序 。 这 个 过 程 比 记 事 本 方便 


















很 多 , 按 图 索 怠 吧 ! 
加 口 ® 多 上 
最 住 匹配 
2 IDLE (Python 3.6 32-bit) 
桌面 应 用 
搜索 建议 > 
只 idle - 查看 网 络 搜索 结果 
IDLE 
图 1-4 搜索 运行 IDLE 
了 Python 3.62 shell “ 口 


File Edit Shell Debug Options Window Help 

Python 3.6.2 (v3.6.2:5fd33b5, Jul 8 2917，64:14:34) [MSC v.19868 32 bit (Intel)] ~ 
on win32 

Type "copyright", "credits" or "license()" for more information. 

>>> 














图 1-5 Python 3.6.2 Shell 
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除了 交互 界面 ,还 可 以 在 这 里 编辑 一 个 文件 ,如 图 1-6 所 示 。 
然后 直接 编辑 五 角 星 程序 ( 见 图 1-7) ,最 后 保存 下 来 ( 见 图 1-8 和 图 1-9) 。 
























































































































| Edit shell Debug Options window Help 改 ~untited* = 
N 2 (v3.6.2:5fd33b5, Jul 8 2 ~ File Edit Format Run Options Window Help 
Open... Cul+O 34) [MSC v.1966 32 bit (Int import turtle ”| 
Open Module.. Alt+M 。 a turtle. forward(200) 
Recent Files t", "credits" or "licens turtle.right(144) 
ClassBrowser 。 AlttC re information- turtle.forward(268) 
Path Browser turtle.right(144) 
turtle.forward(266) 
2 turtle.right(144) 
+Shifte: turtle.forward(268) 
Save Copy As... Alt+Shift+S turtle.right(144) 
PrintWindow 。 col+P turtle.forward(288) 
一 一 一 一 一 -一 一 turtle.right(144) 
close Alt+F4 
Edit col+Q 
图 1-6 打开 一 个 新 文件 图 1-7 编辑 五 角 星 程 序 
器 "Untited* = 7 尖 EE x 
Ele Edit om Opdons Window He 和 ~ 个 > milozou > pycode Y 口 。 搜索 "pycode” 万 
NewFile Ca+N turtle “ 站 
Open... calo .forward(266) 扯 织 ”新 建文 件 到 训 作 保 交 的 路 你 [你 可 以 时 于 oyu © 
OpenModule.. AtrM right(144) 2 ov 人 实时 和 20 时兴 旨 ~ 
Recent Files » .forward(298) WW Desktop 认 所 在 的 位 置 
a i .right(144) pycache_ 201718131 2001 。 安 伯 内 
Pah rower .forward(269) B Downloede gome 20171a127 23:11 。 文 严 
一 .right(144) Evemowe 。 国 myoos 2017/81242339 。 文 (4 严 
.forward(269) 和 fanoy 目 oo 
Cul+shift*S right(144) 
Altrshiftes 。 .forward(296) 文件 8(N}: [wjaoxingpy ”文件 后 给 名 必须 是 .py v 
casp .right(144) 保存 类 型 (): Python files (pyPyw) 四 
和 Ref4 夫 保存 (9) 取消 
1-8 保存 文件 1 图 1-9 保存 文件 2 


现在 这 个 保存 了 指令 集合 的 文件 wujiaoxing. py 就 是 你 的 第 一 个 Python 程序 了 , 按 
F5 键 或 者 选择 菜单 命令 Run->Run Module 就 可 以 让 程序 运行 了 ( 见 图 1-10)。 


器 wujiaoxingpy-C/Users.. 一 口 X 

File Edit Format [RE Options Window Help 

Python Shell 
ee) 


09) 
turtle.right(144) 





Check Module Alt+X 





turtle.forward(266) 
turtle.right(144) 
turtle.forward(266) 
| turtle.right(144) 
turtle.forward(266) 
kurtle.right(144) 








图 1-10 Run 


最 后 ,你 会 发 现 , 五 角 星 画 完 就 消失 了 ,这 是 因为 程序 所 有 指令 执行 完毕 了 ,可 以 在 程 
序 最 后 加 上 一 条 input() 指 令 , 再 看 看 效果 吧 。input() 的 作用 是 等 待 用 户 输入 数据 ,用 户 没 
有 输入 信息 并 回 车 之 前 会 处 于 等 待 状态 。 
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好 了 ,这 就 是 第 一 个 程序 的 诞生 和 运行 过 程 ,是 不 是 并 不 复杂 ? 
> 用 区 汪 熟悉 开发 环境 ， 提 高 编程 效率 
前 面 我 们 利用 IDLE 运行 Python 程序 ,非常 方便 。 另外 ,还 有 一 


种 在 命令 行 模式 下 通过 Python 命令 直接 执行 的 方式 ,在 系统 的 命令 行 
模式 (比如 PowerShell) 执 行 ( 见 图 1-11) 。 





PS C:\Users\milo>python C:/Users/milo/pycode/wujiaoxing.py 回 ba 


提高 编程 效率 
这 里 有 一 些 前 提 , 需 解释 一 下 : 


(1) 不 建议 这 种 模式 执行 。 这 种 模式 执行 比较 便利 的 前 提 是 习惯 在 命令 行 模式 工作 的 
程序 员 ,比如 linux、Mac 用 户 。 

(2) 这 里 的 PS C:\ Users\milo 二 代表 在 系统 命令 行 模式 下 ,当前 所 在 位 置 是 C 盘 下 
Users 目录 下 的 milo 目录 中 ,python 是 系统 命令 ,这 条 命令 不 要 进入 到 Python 交互 环境 中 
执行 。 

(3) python 空格 后 面 是 要 执行 的 程序 文件 ,这 里 涉及 文件 路 径 问题 ,比如 之 前 的 五 角 
星 程序 保存 在 C:/Users/milo/pycode 路 径 下 ,所 以 这 个 命令 是 直接 执行 指定 目录 下 的 
wujiaoxing. py, 这 看 起 来 有 点 麻烦 。 所 以 ,你 有 两 个 选择 : 

Q@ 所 有 程序 都 保存 在 打开 命令 行 模式 时 的 默认 路 径 下 ,比如 这 里 的 默认 路 径 就 是 C:/ 
Users/milo。 

@ 自己 创建 一 个 文件 夹 保存 程序 ,执行 之 前 切换 到 你 创建 的 目录 ,比如 我 创建 的 是 
pycode。 














图 1-11 切换 目录 并 执行 程序 


图 1-11 中 cd 是 系统 用 来 切换 目录 的 命令 ,这 条 命令 的 意思 是 切换 到 当前 目录 下 的 
pycode 目录 中 ,前 提 是 pycode 已 存在 。 你 可 以 通过 dir 命令 查看 当前 目录 下 的 文件 列表 。 
python 后 面 直接 跟 文 件 名 ,没有 路 径 的 意思 ,是 直接 执行 当前 目录 下 的 程序 。 

在 跨 平 台 开 发 过 程 中 ,掌握 命令 行 模式 是 很 有 必要 的 ,这 不 仅 会 让 你 在 外 人 眼 里 看 起 
来 像 个 高 手 , 实 际 上 也 会 让 你 如 虎 添 翼 。 


Python 开发 工具 


除了 Python 自 带 的 IDLE 和 记事 本 以 外 ,还 有 很 多 流行 的 开发 工具 ,在 实际 工作 中 可 


以 选择 一 个 适合 自己 的 。 
G5) 
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Vim、Emacs: 老牌 编辑 器 ,类 似 Winows 的 记事 本 ,是 神 一 样 的 存在 ,Vim 更 是 被 称 为 
编辑 器 之 神 。 如 果 不 是 Windows 用 户 ,强烈 推荐 使 用 ;Emacs 则 被 称 为 神 的 编辑 器 ,一 般 人 
用 不 了 , 太 烦 琐 。 

notepad 十 十 ,editplus: Windows 下 的 老牌 编辑 工具 ,不 过 ,此 老 非 彼 老 ,地 位 比 Vim 
差 很 多 ,但 作为 比较 轻 量 化 的 工具 还 是 很 好 用 的 。 

Pydev、Pycharm、Spyder: 都 是 比较 专业 的 集成 环境 。Pycharm 比较 好 用 ,分 商业 版 和 
共享 版 ,推荐 使 用 ,不 用 Vim 就 推荐 Pytharm, 其 他 开发 工具 可 根据 习惯 和 实际 工作 环境 决 
定 是 否 使 用 。 

另外 ,还 有 诸如 做 科学 计算 的 集成 环境 python(x,y) 等 ,包含 了 非常 全 面 、 做 科学 计算 
会 用 到 的 包 , 还 包含 了 Spyder。 

在 这 里 我 仅 做 一 点 说 明 , 初 学 时 不 必 和 刻意 使 用 这 些 IDLE, Python 自 带 的 IDLE 
(PythonShell) 就 足够 用 了 ,而 且 我 也 建议 使 用 系统 自 带 的 、 最 纯粹 的 方式 去 学 习 。 很 多 教 
编程 的 老师 一 上 来 搭 完 环境 ,就 开始 用 一 些 很 先进 的 工具 ,看 起 来 好 像 很 专业 ,实际 对 新 手 
了 解 基 本 工作 原理 没有 帮助 ,况且 这 些 工具 ,有 些 做 了 高 度 的 包装 和 功能 集成 ,新 手 经 常会 
无 从 下 手 。 但 是 如 果 你 只 会 用 自 带 的 IDLE ,作为 实战 开发 来 讲 , 效 率 是 不 够 的 。 建 议 在 学 
完全 部 语法 之 后 开始 使 用 这 些 IDLE ,并且 找到 适合 自己 的 。 


> 驮 区 二 第 三 方 模块 和 工具 管理 


Python 除了 自 带 的 模块 之 外 ,还 有 很 多 第 三 方 模块 和 工具 ,这 些 第 三 方 模块 功能 各 异 ， 
有 的 功能 只 需要 一 个 模块 就 可 以 实现 ,比如 turtle, 有 的 是 几 个 库 协同 工作 完成 一 个 任务 ， 
比如 机 器 学 习 可 能 需要 scikit-learn、numpy、pandas、scipy 等 。 

当 需 要 第 三 方 库 时 ,有 两 种 选择 : 一 种 是 初学 阶段 推荐 采用 的 方式 ,就 是 需要 什么 就 一 
个 一 个 地 安装 ; 另 一 种 是 直接 安装 诸如 Anaconda 这 样 的 包 管 理 器 和 环境 管理 器 。 
Anaconda 附带 了 一 大 批 常 用 的 数据 科学 包 , 包 括 conda、Python 和 150 多 个 科学 包 及 其 依 
赖 项 ,因此 可 以 立即 开始 处 理 数据 。Anaconda 是 在 conda( 一 个 包 管理 器 和 环境 管理 器 ) 基 
础 上 发 展 出 来 的 。conda 可 以 帮助 你 为 不 同 的 项 目 建立 不 同 的 运行 环境 ,比如 在 项 目 A 中 
用 了 Python 2 ,而 在 项 目 B 使 用 了 Python 3( 同 时 安装 两 个 Python 版 本 可 能 会 造成 许多 混 
乱 和 错误 ) ,这 时 候 conda 就 可 以 帮 你 解决 问题 ,不 过 这 本 书 不 会 过 多 介绍 Anaconda ,你 也 
不 要 着 急 现在 了 解 ,学 到 一 定 程度 时 , 若 有 需要 ,再 自行 学 习 即 可 。 

现在 我 们 要 解决 一 个 实际 问题 ,你 已 经 知道 在 命令 行 模式 中 不 能 执行 Python 指令 ,在 
Python 中 也 不 能 执行 系统 命令 , 那 如 果 我 们 在 Python 环境 下 测试 指令 时 又 需要 执行 一 些 
系统 命令 ,该 怎么 办 呢 ? 退出 Python ,执行 完 系统 命令 之 后 再 进去 ? 这 样 是 可 以 ,但 是 却 很 
麻烦 ,实际 上 如 果 开发 的 程序 跟 系统 文件 有 关系 ,这 样 的 操作 会 很 频繁 。 

所 以 ,我 们 来 认识 一 个 新 的 工具 Ipython, 并 且 通 过 安装 Ipython ,了解 Python 怎样 管 
理 第 三 方 库 。 

Ipython 是 增强 的 PythonShell ,不 仅 可 以 执行 Python 指令 ,还 支持 执行 常用 系统 命令 。 

Ipython 是 一 个 独立 的 工具 ,相当 于 在 你 的 Python 之 上 加 了 一 层 增强 外 壳 , 所 以 需要 
先 安装 Python 再 安装 Ipython。Ipython 程序 源 代码 和 其 他 Python 模块 一 样 ,都 托管 在 
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PyPI 上 ( 见 图 1-12), 目 前 ,权威 的 PyPI(Python Package Index) 地 址 是 https://pypi. org/， 
这 个 PyPI 就 像 个 大 仓库 一 样 ,pypi. python. org 是 重 定向 到 官网 的 。 
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1-12 python.org 网 站 


这 些 在 安装 Python 时 不 具备 的 库 , 称 为 第 三 方 库 , 当然 ,你 并 不 需要 打开 网 页 下 载 ,可 
以 通过 pip 命令 很 轻松 地 管理 PyPI 上 的 这 些 库 ( 我 们 在 安装 Python 时 的 可 定制 步骤 已 经 
见 过 pip, 如 果 没 有 pip 命令 ,那么 快 想 想 原因 吧 )。 后 面 我 们 还 会 用 pip 安装 其 他 库 , 这 里 
先 用 Ipython 做 一 个 第 三 方 库 管理 的 练习 ( 见 图 1-13) 。 





In 提示 符 后 输入 python 指 令 执 行 即 可 


强大 之 处 在 于 ipython 中 支持 一 些 常用 的 系统 命 全 








图 1-13 ”Ipython 环境 


(1) 安装 (注意 大 小 写 ) 
PS C:\Users\milo>pip install Ipython 
(2) 查询 


PS C:\Users\milo>pip show Ipython 


A 
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(3) 印 载 
PS C:\Users\milo>pip uninstall Ipython 


(4) 升级 ,如 果 未 安装 则 直接 安装 


PS C:\Users\milo>pip uninstall -U Ipython 


安装 后 我 们 来 试 运行 一 下 。 
Ipython 还 有 很 多 强大 的 功能 ,在 初期 作为 辅助 工具 ,暂时 不 做 过 多 介绍 。 


(> 性 民 基 像 程序 员 一 样 写 代 码 


前 面 说 过 ,程序 不 是 写 给 自己 看 的 ,通常 也 不 是 一 个 人 写 的 ,所 以 ， 
养 成 良好 的 编码 习惯 至 关 重要 。 有 很 多 具有 多 年 编程 经 验 的 程序 员 ， 
工作 态度 不 端正 ,编写 的 程序 功能 上 差不多 就 行 了 。 这 类 程序 员 设计 
的 程序 本 身 并 不 精巧, 结构 混乱 ,甚至 只 是 盲目 地 堆砌 代码 ,仅仅 以 实 
现 功 能 为 准 , 连 注释 也 写 得 稀里糊涂 。 你 可 能 认为 这 是 个 别 现象 ,但 其 
实 ,我 说 的 这 些 并 不 是 偶然 现象 。 所 以 ,如 果 有 那么 多 不 认真 的 程序 
员 , 那 至 少 自己 做 一 股 清流 吧 ! 保持 正确 姿势 起 飞 ,才能 越 飞越 高 。 

现在 , 画 五 角 星 的 方法 有 了 , 写 代码 的 工具 有 了 ,代码 也 写 了 ,程序 
就 已 经 是 能 运行 的 程序 了 。 但 是 ,能 运行 的 程序 不 一 定 是 好 程序 ,所 
以 ,在 写 更 多 的 代码 之 前 ,我 们 先 把 程序 的 组 成 和 写 代码 基本 的 规则 了 
解 一 下 。 

什么 样 的 代码 是 好 代码 ? 这 个 定义 起 来 似乎 有 说 不 完 的 话题 ,不 
过 如 果 你 清楚 程序 的 组 成 部 分 ,能 做 到 遵循 语言 的 编码 规范 ,那么 ,你 站 
写 出 来 的 代码 至 少 看 上 去 不 会 太 精 糕 。 

程序 的 组 成 按 功 能 分 ,有 注释 ,模块 .表达 式 和 语句 空白 。 

对 于 Python 的 编码 规范 ,官方 有 专门 的 文档 PEP 8, 可 以 通过 python. org 找到 ,如 
图 1-14 所 示 。 

对 初学 者 来 说 ,肯定 会 觉得 文档 内 容 太 多 ,比如 涵盖 了 空 行 .空格 、 注 释 等 ,而 且 很 多 内 
容 还 没有 学 到 ,不 知道 是 什么 意思 ,所 以 不 必 现 在 就 搞 清楚 所 有 编码 规范 ,你 只 要 在 脑子 里 
记 住 有 一 个 编码 规范 就 好 ,本 章 将 结合 程序 的 组 成 部 分 和 编码 规范 做 一 些 说 明 。 


15.1 注释 

注释 在 程序 运行 过 程 中 是 可 有 可 无 的 , 它 是 附加 在 程序 上 的 说 明 或 者 简单 的 标识 。 但 
是 ,能 否 写 好 注释 或 者 正确 地 做 注释 是 一 个 优秀 程序 员 的 必修 课 , 因 为 在 实际 工作 中 ,涉及 
团队 协作 的 项 目 , 或 者 更 改 别人 的 代码 ,都 会 涉及 代码 的 调用 和 调试 ,能 够 在 最 短 时 间 内 理 


解 程序 的 作用 ,对 提高 工作 效率 是 非常 有 帮助 的 。 
Python 中 的 注释 有 单行 注释 ( 行 注释 和 块 注释 ) 和 多 行 注释 (文档 字符 串 docstring) 。 
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1-14 PEP8 


还 有 一 些 特殊 形式 的 注释 ,比如 关于 中 文 的 注释 。 下 面 我 们 分 开 来 讲 。 
1. 单行 注释 ( 行 注 释 和 块 注释 ) 


Python 中 使 用 # 作为 单行 注释 符 ,在 程序 执行 过 程 中 ,# 右 侧 的 代码 或 者 内 容 是 不 会 
被 执行 的 。 最 需要 写 注 释 的 是 代码 中 那些 技巧 性 的 部 分 ,如 果 在 下 次 代码 审查 时 必须 解释 
一 下 ,那么 你 应 该 现在 就 给 它 写 注释 。 对 于 复杂 的 操作 ,应 该 在 其 操作 开始 前 写 上 若干 行 
注释 。 对 于 不 是 一 目 了 然 的 代码 ,应 在 其 行 尾 添加 注释 ,为 了 提高 可 读 性 ,注释 应 该 至 少 离 
开 代码 2 个 空格 。 例 如 : 

#We use a weighted dictionary search to find out where i is in 

#the array. We extrapolate position based on the largest num 


#in the array and the array size and then do binary search to 
#get the exact number. 


if i & (i-1) == 0: #true if i isa power of 2 


另 一 方面 , 绝 不 要 描述 代码 (假设 阅读 代码 的 人 比 你 更 懂 Python, 他 只 是 不 知道 你 的 代 
码 要 做 什么 ) 。 


#BAD COMMENT : Now go through the b array and make sure whenever i occurs 
#the next element is i+1 


2. 多 行 注释 (文档 字符 串 doctring ) 
如 果 需 要 注释 的 内 容 是 一 个 段落 ,就 需要 进行 多 行 注释 。Python 有 一 种 独一无二 的 注 
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释 方式 : 使 用 文档 字符 串 ,也 叫 docstring。 文 档 字符 串 是 包 、 模 块 . 类 或 函数 里 的 第 一 个 语 
句 。 这 些 字 符 串 可 以 通过 对 象 的 _doc__ 属 性 被 自动 提取 (对 象 概念 属于 后 面 的 面向 对 象 
部 分 ) ,我 们 对 文档 字符 串 的 惯例 是 使 用 三 重 双 引 号 """ (PEP-257) 。 一 个 文档 字符 串 应 该 
这 样 组 织 : 首先 是 一 行 以 句号 、 间 号 或 惊叹 号 结尾 的 概述 (或 者 该 文档 字符 串 单纯 只 有 一 
行 ) ;接着 是 一 个 空 行 ;然后 是 文档 字符 串 剩 下 的 部 分 , 它 应 该 与 文档 字符 串 第 一 行 的 第 一 
个 引号 对 齐 。 例 如 : 


class SampleClass (object): 
"""Summary of class here. 


Longer class information... 
Longer class information... 


Attributes: 
likes spam: A boolean indicating if we like SPAM or not. 


eggs: An integer count of the eggs we have laid. 
mm 


def _ init _(self, likes spam=False): 
"wn"Inits SampleClass with blah.""" 
self.likes spam= likes spam 
self.eggs =0 


def public method (self): 
"""Performs operation blah.""" 


如 果 单 双 引 号 要 细 分 ,一般 类 文档 、 函 数 文档 、 字 符 串 之 类 的 用 双 引 号 ,变量 用 单 引号 。 
3. Shebang 


在 计算 机 科学 中 , Shebang (也 称 为 Hashbang) 是 一 个 由 # 号 和 叹 号 构成 的 字符 串 行 
〈#!1) ,其 出 现在 文本 文件 第 一 行 的 前 两 个 字符 。 

如 果 看 源 代 码 ,你 会 发 现在 Linux/UNIX 系统 下 的 Python 程序 会 经 常 在 第 一 行 就 看 
到 # !V/usr/bin/env python 这 样 一 条 注释 , 它 的 作用 是 告诉 Linux/UNIX 去 找到 Python 的 
解释 器 ,就 好 像 给 系统 指 路 一 样 。 在 脚本 被 直接 运行 时 会 起 到 作用 (Windows 下 没 用 ), 否 
则 ,系统 会 因为 找 不 到 Python 解释 器 而 无 法 运行 脚本 。 需 要 注意 的 是 : 

(1) 必须 是 文件 的 第 一 行 。 

(2) 必须 以 # ! 开 头 。 

大 部 分 . py 文件 不 必 以 # ! 作 为 文件 的 开始 。 根 据 PEP-394, 程 序 的 main 文件 应 该 以 
# !/usr/bin/python2 或 者 #1/usr/bin/python3 开始 。 在 文件 中 存在 Shebang 的 情况 下 ， 
类 UNIX 操作 系统 的 程序 载 人 器 会 分 析 Shebang 后 的 内 容 , 将 这 些 内 容 作 为 解释 器 指令 ， 
并 调用 该 指令 ,并 将 载 有 Shebang 的 文件 路 径 作为 该 解释 器 的 参数 。 例 如 ,以 指令 #1/bin/ 
sh 开头 的 文件 在 执行 时 会 实际 调用 /bin/sh 程序 。 

# ! 用 于 帮助 内 核 找到 Python 解释 器 , 但 是 在 导入 模块 时 会 被 忽略 。 因 此 只 有 被 直接 
执行 的 文件 中 才 有 必要 加 入 #1。 
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4. 中 文 问题 


如 果 程 序 中 使 用 了 中 文 ,不论 是 执行 代码 ,还 是 注释 内 容 。 都 要 加 上 中 文 编码 的 特殊 
注释 ,例如 : 


#-*- coding: utf-8-*-— 


看 到 # ,你 会 想到 这 是 一 个 单行 注释 ,关键 在 于 后 面 的 utf-8, 这 里 涉及 关于 中 文 编码 的 
问题 。 

Python 解释 器 在 加 载 . py 文件 中 的 代码 时 ,会 对 内 容 进 行 编码 (默认 ASCID 。 

Python 2 中 ,文件 的 默认 编码 为 ASCILI, 在 文件 中 含有 中 文 时 会 报错 ,因此 要 在 文件 开 
头 写 上 : 


#-*- coding: utf-8-*-— 


指定 编码 类 型 为 UTF-8。 

Python 3 中 ,文件 的 默认 编码 为 UTF-8, 已 经 不 存在 上 述 问题 了 。 

小 知识 : 

ASCII(American Standard Code for Information Interchange, 美 国标 准 信息 交换 代码 ) 
是 基于 拉丁 字母 的 一 套 计算 机 编码 系统 ,主要 用 于 显示 现代 英语 和 其 他 西欧 语言 ,其 最 多 
只 能 用 8 位 来 表示 (一 个 字 节 ), 即 2 一 256, 所 以 ,ASCII 码 最 多 只 能 表示 256 个 符号 。 

显然 ASCII 码 无 法 将 世界 上 的 各 种 文字 和 符号 全 部 表示 ,因此 就 需要 一 种 可 以 代表 所 
有 字符 和 符号 的 编码 , 即 Unicode。 

Unicode( 万 国 码 ) 是 为 了 解决 传统 的 字符 编码 方案 的 局 限 而 产生 的 , 它 为 每 种 语言 中 
的 每 个 字符 设 定 了 统一 且 唯 一 的 二 进 制 编码 ,规定 所 有 的 字符 和 符号 最 少 由 16 位 来 表示 
(2 个 字 节 ), 即 : 2" 一 65536 。 

UTF-8 是 对 Unicode 编码 的 压缩 和 优化 , 它 不 再 局 限于 最 少 使 用 2 个 字 节 ,而 是 将 所 
有 字符 和 符号 进行 分 类 : ASCII 码 中 的 内 容 用 1 个 字 节 保存 、 欧 洲 的 字符 用 2 个 字 节 保存 ， 
东亚 的 字符 用 3 个 字 节 保存 …… 

最 后 ,对 注释 的 使 用 做 一 个 总 结 说 明 。 

(1) 为 了 避免 不 必要 的 麻烦 ,必要 时 可 以 直接 在 文件 的 开头 加 上 : 


#!/usr/bin/env python 

#-*- coding: utf- 8 - 关 

(2) 每 一 个 Python 文件 的 开头 ,第 一 条 的 两 行 代码 之 后 ,经 常 要 写 上 关于 这 个 模块 ,也 
就 是 这 个 Python 文件 实现 的 功能 、 注 意 事 项 、 可 能 会 发 生 的 错误 ,总 之 注释 要 让 使 用 者 对 
程序 有 个 直观 认识 ,例如 : 


requests .cookies 
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Compatibility code to be able to use 'cookielib.CookieJar' with requests. 
requests .utils imports from here, so be careful with imports. 


做 到 不 看 代码 ,就 已 经 知道 接 下 来 的 是 什么 了 。 
(3) 每 一 个 类 下 面 加 上 关于 这 个 类 的 说 明 以 及 用 法 ,这 样 使 用 程序 的 人 不 需要 知道 程 
序 内 部 构造 ,就 可 以 使 用 了 ,例如 : 


class HTTPAdapter (BaseAdapter): 
"""The built-in HTTP Adapter for urllib3. 
Provides a general- case interface for Requests sessions to contact HTTP and 
HTTPS urls by implementing the Transport Adapter interface. This class will 
usually be created by the :class:'Session ' class under the covers. 
:Param pool connections: The number of urllib3 connection pools to cache. 
:Param pool maxsize: The maximum number of connections to save in the pool. 
:Param max_ retries: The maximum number of retries each connection 
should attempt. Note, this applies only to failed DNS lookups, socket 
connections and connection timeouts, never to requests where data has 
made it to the server. By default, Requests does not retry failed 
connections. If you need granular control over the conditions under 
which we retry a request, import urllib3's ''Retry'' class and pass 
that instead. 
:Param pool block: Whether the connection pool should block for connections . 
Usage:: 
>>>import requests 
>>>s =requests.Session() 
>>>a =requests.adapters.HTTPAdapter (max retries=3) 
>>>s .mount ('http://', a) 


第 一 行 定 义 了 一 个 类 ,类 内 部 的 三 引号 注释 对 这 个 类 “是 干什么 的 ”经常 在 什么 情况 
下 使 用 ”如 何 使 用 ”都 做 了 很 详细 的 说 明 。 

(4) 每 一 个 函数 下 面 务必 加 上 多 行 注释 ,当然 ,如 果 函 数 注释 只 有 一 行 或 者 两 行 ,可 以 
使 用 单行 注释 ,也 可 以 使 用 多 行 注 释 , 这 里 与 类 函数 说 明 相 当 , 注 释 中 往往 包含 使 用 说 明 及 
注意 事项 。 例 如 


def _ setstate _(self, state): 


#Can't handle by adding 'proxy manager' to self. attrs _because 





#self.poolmanager uses a lambda function, which isn't pickleable. 
def has capacity(self): 


"""Does the engine have capacity to handle more Spiders""" 
return not bool (self.slot) 


(5) 在 必要 的 地 方 加 上 单行 注释 ,例如 : 
Q@ 你 不 太 理 解 的 代码 。 
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@ 别人 可 能 不 理解 的 代码 。 
@ 提醒 自己 或 者 别人 注意 的 代码 和 重要 的 代码 。 
总 之 ,注释 很 重要 ,但 不 是 越 多 越 好 ,那些 能 够 一 眼 就 看 懂 的 代码 ,就 无 须 画蛇添足 了 。 


152 模块 导入 


模块 是 Python 的 命令 集 (通常 就 是 Python 文件 ), 可 以 在 一 个 脚本 中 导入 另 一 个 模 
块 ,也 可 以 把 模块 导入 到 PythonShell 的 交互 模式 下 。 导 入 方式 如 下 : 


>>>import module 


模块 是 Python 的 重要 组 成 部 分 ,也 是 Python 之 所 以 强大 的 原因 ,安装 Python 时 ,其 
中 自 带 的 模块 有 二 三 百 个 ,但 对 于 有 些 工作 来 讲 , 这 还 是 不 够 的 。 所 以 ,我 们 还 可 以 安装 第 
三 方 模块 ,而 且 既 然 模块 就 是 Python 脚本 ,那么 ,你 完全 可 以 自己 编写 模块 完成 私人 订 制 。 
至 于 结构 ,从 turtle 绘图 的 例子 ,大 家 应 该 也 发 现 了 ,如 果 要 想 使 用 模块 的 功能 ,就 要 先导 
人 。 从 能 用 的 角度 来 说 , 现 用 现 导 就 行 ; 从 结构 来 说 , 导 和 人 模块 的 语句 通常 都 在 最 前 面 , 这 
样 比较 直观 ,一 眼 就 知道 当前 程序 使 用 了 哪些 模块 。 


15.3 ”表达 式 和 语句 


Python 中 的 代码 可 以 分 成 两 类 : 表达 式 和 语句 。 

(1) 表达 式 : 值 和 运算 符 的 组 合 ,会 产生 新 值 , 这 一 点 跟 数 学 表达 式 的 定义 是 一 致 的 。 
比如 ,在 交互 模式 输入 1 十 1 会 显示 2, 这 就 是 说 表达 式 1 十 1 显示 返回 值 2。 

(2) 语句 : 执行 任务 的 指令 ,没有 返回 值 。 比 如 ,x = 1 十 1 是 一 个 语句 ,其 中 的 1 十 1 
是 表达 式 。 

>>>x =2 # 语 句 

>>>x +3 # 表 达 式 


5 # 返 回 值 

>>>y =x+3 # 语 句 , 等 号 右 侧 的 x + 3 是 表达 式 

>>>y # 语 句 

可 # 这 个 5 不 是 返回 值 , 程 序 中 这 样 执行 看 不 到 结果 ,交互 会 话 中 能 看 到 


15.4 合理 利用 空白 

艺术 讲究 留 白 , 写 程序 也 一 样 ,代码 中 合理 地 使 用 空格 、 空 行 、 缩 进 等 ,可 以 大 大 地 提高 
代码 的 可 读 性 。 但 是 ,如 果 滥 用 ,虽然 运行 可 能 没 问题 ,但 对 于 阅读 代码 的 人 来 说 却 是 灾 
难 。 本 书 中 有 些 例子 为 了 考虑 版 面 可 能 不 会 完全 遵循 这 个 原则 。 但 是 ,你 在 写 代码 时 要 养 
成 好 习惯 ,多 些 空白 并 不 会 造成 太 多 浪费 。 

企 桂 行 

顶级 定义 之 间 空 两 行 ,比如 函数 或 者 类 定义 。 方 法 定义 、 类 定义 与 第 一 个 方法 之 间 都 
应 该 空 一 行 ; 函 数 或 方法 中 , 某 些 地 方 若 合适 就 空 一 行 。 主 要 目的 还 是 为 了 阅读 方便 。 
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2. 空格 


空格 是 在 代码 中 使 用 最 多 的 ,可 能 也 是 最 乱 的 ,有 时 , 跟 个 人 习惯 有 很 大 关系 。 建 议 大 
家 按照 标准 排版 规范 使 用 标点 两 边 的 空格 。 

(1) 不 要 在 逗号 ,分 号 .冒号 前 面 加 空格 ,在 它们 后 面 加 ,如 果 是 行 尾 , 则 不 加 ;括号 内 不 
要 有 空格 。 


正确 : spam (ham[1], {eggs: 2}, []) 
错误 :spam( ham[ 1], {eggs:2},[]) 





(2) 在 二 元 操作 符 两 边 都 加 上 一 个 空格 ,比如 ,赋值 (= 二) 、 比 较 ( :>,!= ,<>、 


二 = 一、 一 、in\not in,is,is not) ,布尔 (and、or、not)。 





正确 :x == 1 
错误 :x<1 


(3) 当 三 用 于 指示 关键 字 参 数 或 默认 参数 值 时 ,不 要 在 其 两 侧 使 用 空格 。 


正确 ;def complex (real, imag=0.0): return magic(r=real, i=imag) 
错误 :def complex (real, imag = 0.0): return magic(r = real, i = imag) 


(4) 不 要 用 空格 来 垂直 对 齐 多 行 间 的 标记 ,看 起 来 很 整齐 ,但 是 这 会 成 为 维护 的 负担 
(适用 于 ,，、# 一 等 ) 。 


正确 : 
foo = 1000 # 等 号 不 需要 对 齐 
long_name = 2 # 注 释 不 需要 对 齐 


dictionary = 1{ 
"foo": 1, 
"long name": 2, 
} 
错误 : 
foo = 1000 # 等 号 不 需要 对 齐 
long name = 2 # 注 释 不 需要 对 齐 


dictionary = { 
"foo" : 1 
"long name": 2, 
} 


3. 缩 进 


Python 中 的 缩 进 除了 可 以 用 来 对 齐 相同 特征 的 元 素 , 使 代码 更 具 可 读 性 之 外 ,更 重要 
的 是 ,可 以 用 来 分 组 。 对 于 需要 组 合 在 一 起 的 语句 或 表达 式 ,Python 采用 相同 空格 的 缩 进 
进行 区 分 ,比如 函数 和 它 的 代码 块 。 


© 
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在 Python 程序 员 的 世界 里 ,使 用 4 个 空格 缩 进 代码 很 重要 。 因 为 不 这 样 做 ,可 能 会 让 
你 在 同行 中 看 起 来 很 不 专业 。 当 然 ,后 面 实验 时 你 会 发 现 几 个 空格 都 行 ,用 Tab 键 也 行 ,但 
是 在 你 明确 知道 用 Tab 键 的 意义 之 前 不 要 用 Tab 键 ( 在 有 些 IDLE 里 面 可 以 设置 Tab 键 为 
4 个 空格 ,这 种 情况 下 Tab 键 等 同 于 4 个 空格 ) ,更 不 能 空格 和 Tab 键 混合 使 用 。 


下 面 看 一 下 对 齐 的 使 用 形式 。 


正确 : 

# 与 起 始 变量 对 齐 

foo = long function name (Var one, var two, 
Var three, var four) 


# 字 典 中 与 起 始 值 对 齐 
foo={ 
long dictionary key: valuel + 
value2, 


} 


#4 个 空格 缩 进 ,第 一 行 不 需要 

foo = long function name( 
Var one, var two var three， 
var four) 


# 字 典 中 4 个 空格 缩 进 
foo={ 
long dictionary key: 
long dictionary value, 


L 

错误 : 

# 第 一 行 有 空格 是 禁止 的 
foo = 1ong function name(var one, var two, 
var three, var four) 


#2 个 空格 是 禁止 的 
foo = long function name( 
Var one, var two, var three, 


Var four) 


# 字 典 中 没有 处 理 缩 进 
foo = { 
long dictionary key: 
long dictionary value, 
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| 加 重点 提示 


在 这 一 章 中 ,你 要 掌握 的 内 容 : 

(1) 明确 import 的 作用 。 

(2) 熟悉 Python 的 交互 模式 并 在 交互 模式 下 执行 Python 指令 。 
(3) 熟悉 IDLE 并 编写 执行 第 一 个 Python 程序 。 

(4) 会 在 命令 行 模式 执行 Python 程序 。 

(5) 能 通过 pip 管理 第 三 方 模块 ( 库 ) 。 

(6) 明确 编码 规范 。 


3 动 动手 


(1) 通过 pip 安装 Ipython。 

(2) 分 别 在 Python 和 Ipython 中 用 turtle 模块 画 一 个 五 角 星 。 

(3) 通过 IDLE 编写 并 保存 五 角 星 的 脚本 到 上 一 章 创 建 的 My Python Code 文件 夹 , 用 
Run 命令 和 F5 键 各 执行 一 次 。 

(4) 在 命令 行 模 式 下 找到 五 角 星 脚本 ,直接 在 命令 行 执行 。 


要 挑战 自己 


现在 ,你 已 经 可 以 用 turtle 画 五 角 星 了 ,从 现在 开始 到 接 下 来 的 学 习 过 程 中 你 可 以 试 着 
完成 一 项 新 手 任务 挑战 一 一 画 美国 国旗 。 这 个 挑战 的 目的 在 于 培养 独立 解决 未 知 问题 的 
能 力 , 请 相信 ,这 将 会 是 你 成 为 程序 员 之 后 必 备 的 能 力 。 如 果 在 这 个 过 程 中 你 觉得 有 难度 ， 
可 以 在 后 续 的 学 习 过 程 中 ,通过 新 的 知识 来 提高 自己 的 能 力 ,解决 碰 到 的 问题 ,完成 这 个 挑 
战 会 使 你 对 语法 基础 的 掌握 有 很 大 帮助 。 

美 旗 于 1777 年 7 月 14 日 正式 被 规定 并 且 开 始 使 用 。 第 一 面 美 旗 ( 见 图 1-15) 
13 个 星 ,13 个 条 。 



























































图 1-15 第 一 面 美国 国旗 


























随 着 行政 版 图 的 变化 ,美国 国旗 也 在 不 断 变 化 ,1818 年 的 第 三 面 美国 国旗 ( 见 图 1-16)， 
就 变 成 了 20 个 星星 ,13 个 横 条 。 这 个 星星 排列 比较 规则 ,可 以 先 画 这 个 。 

建议 : 使 用 至 少 4 个 函数 。 美 国 国旗 中 正 多 边 形 都 作为 函数 处 理 。 现 在 画 不 出 来 ,可 
以 等 到 学 完 函 数 再 画 。 
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图 1-16 第 三 面 美 国 国旗 


相信 现在 你 对 编程 已 经 有 兴趣 了 。Python 还 有 很 多 模块 ,而 且 大 部 分 像 turtle 模块 一 
样 ,看 懂 说 明 书 就 能 用 。 但 这 并 不 能 解决 所 有 问题 ,况且 没有 扎实 的 基础 ,根本 看 不 懂 模 块 
的 源 代码 ,程序 员 大 部 分 工作 都 是 在 编码 写 程序 ,而 程序 就 是 由 最 基本 的 语句 按照 一 定 的 
语法 组 织 起 来 的 。 所 以 不 知道 语句 怎么 写 ,不 知道 语法 规则 ,有 再 多 模块 也 是 没 用 的 。 


(> 委 及 着 程序 开发 全 局 观 


初学 编程 的 人 经 常会 被 一 些 琐碎 的 知识 点 牵 绊 ,也 可 能 会 纠结 于 某 一 个 功能 或 某 几 行 
代码 。 比 如 ,我们 打算 开发 一 个 游戏 需要 做 些 什 么 事 呢 ? 先 闭 上 眼睛 ,在 脑子 里 想 一 想 , 第 
一 个 想法 是 代码 怎么 编写 吗 ? 应 该 不 是 ,如 果 不 出 意外 ,你 的 想法 大 概 是 “开发 一 个 游戏 
“什么 样 的 游戏 ”怎么 玩 ” 游 戏 里 面 都 能 干什么 ?诸如 此 类 ,应 该 不 会 马上 就 想到 要 怎么 写 
代码 ,更 不 会 有 人 马上 打开 计算 机 开 敲 键盘 。 所 以 ,程序 员 在 实际 工作 中 更 需要 有 全 局 观 ， 
从 整体 考虑 程序 的 实现 过 程 。 

一 个 程序 从 无 到 有 ,简单 说 就 是 三 步 : 需求 分 析 ,程序 设计 和 编码 测试 。 下 面 我 们 就 在 
这 些 关键 点 ,用 一 个 虚拟 项 目 ( 英 雄 无 敌 ) 来 做 说 明和 演示 。 

为 了 更 直观 地 感受 所 学 习 的 知识 在 程序 设计 中 的 体现 ,在 本 书 
适当 位 置 ,会 借助 (英雄 无 敌 》 这 个 虚拟 项 目 ,把 需要 用 到 的 知识 点 更 
直观 .更 生动 地 引出 来 ,实现 从 0 到 1 的 过 程 ,然后 通过 延伸 问题 的 
引导 ,在 迭代 开发 的 过 程 中 ,完成 属于 自己 的 (英雄 无 敌 》。 

按 项 目 开发 的 流程 ,首先 进行 需求 分 析 。 这 是 开发 人 员 经 过 深 
人 细致 的 调研 和 分 析 ,准确 理解 用 户 和 项 目的 功能 .性 能 .可靠 性 等 
具体 要 求 ,将 用 户 的 需求 表述 转化 为 完整 的 需求 定义 ,从 而 确定 系统 
必须 做 什么 的 过 程 。 比 如 针对 《英雄 无 敌 》, 作 为 用 户 会 想到 一 些 初步 的 零散 需求 : 

(1) 注册 登录、 验证 。 

(2) 给 角色 起 个 名 字 ,初始 化 英雄 。 

(3) 游戏 的 开场 前 奏 。 

(4) 英雄 人 物 满 血 出 场 。 

(5) 有 地 图 ,可 以 在 地 图 上 走 。 

(6) 在 地 图 上 行走 时 ,发 生 随机 事件 。 





《英雄 无 敌 ) 和 迭代 开发 游 
戏 : 需求 分 析 、 实 现 
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通常 这 样 的 需求 很 多 ,项 目 越 大 ,参与 的 人 越 多 ,需求 就 越 复杂 ,而 且 通 常 还 会 变 来 变 
去 ,程序 员 的 工作 就 是 把 这 些 需求 变 成 代码 。 现 在 你 自己 是 用 户 兼 产品 经 理 兼 程序 员 , 需 
求 可 以 根据 你 掌握 的 编程 能 力 进行 适当 调整 。 不 过 ,建议 从 需求 出 发 ,想到 什么 功能 ,就 想 
办 法 去 实现 它 。 

对 需求 进行 深入 细致 分 析 后 , 先 不 要 马上 开始 写 代码 ,而 是 要 构思 程序 结构 以 及 实现 
的 功能 ,最 后 才 落 到 编码 上 ,然后 进入 编码 测试 阶段 ,实现 功能 之 后 再 迭代 优化 。 

针对 上 述 需 求 , 并 提炼 简化 , 列 出 首先 要 实现 的 功能 : 

(1) 游戏 开局 ,玩家 输入 角色 名 字 。 

(2) 判断 用 户 名 字 是 否 为 空 , 若 为 空 , 则 英雄 名 字 初 始 化 为 回 ! 
player01 。 F 

(3) 初始 化 英雄 属性 ,包括 名 字 、 血 值 100。 

(4) 交互 提示 游戏 流程 信息 。 

(5) 设计 一 个 线形 地 图 ,玩家 可 以 在 地 图 上 移动 。 

有 了 精确 的 功能 列表 (作为 菜鸟 的 第 一 个 需求 就 是 能 提炼 出 核心 
问题 ) 就 很 容易 写 出 代码 了 ,下 面 就 是 简陋 的 (英雄 无 敌 》0. 1 版 。 





《英雄 无 敌 ) 选 代 开 发 
游戏 : coding 


#Heroes-0.1.py 
Heroes beta-0.1 
milo 


i 
hp = 100 


print('welcome Heroes world!') 
print("|the world is like this #####,'a'for left,'d' for right |") 


name = input ('input your name:') 


if not name: 
name = 'player01' 


usermsg = [name,hp] 


print ("your hero's name is:",usermsg [0],'Hp is :',usermsg[1]) 
print ("and now you are here: * ####|'a'for left,'d' for right |") 


userinput = input () 


if userinput == 'd': 
print ("your are here # x* ###.") 


if userinput == 'a': 
print ("your are here x ####") 


怎么 做 到 有 了 几 条 需求 就 写 出 这 么 多 东西 呢 ? 别 着 急 , 代 码 看 上 去 很 多 ,其 实 核 心 功 


A 
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能 并 不 复杂 ,都 是 很 直 白 的 功能 ,仔细 看 看 代码 里 面 的 单词 ,就 能 想到 是 什么 样子 , 运 和 
来 是 这 样 的 。 


i 
[En 


>>> 

========== RESTART: C:\Users\milo\pycode\Heroes-0.1.py ======== 
welcome Heroes world! 

Ithe world is like this #####,'a'for left, 'd' for right | 

input your name:milo 

Your hero's name is: milo Hp is : 100 

and now you are here: *####|'a'for left,'d' for right | 

d 

your are here # * ### 

>>> 


这 段 代 码 用 到 的 知识 有 变量 、 结 构 化 数据 输入 /输出 和 判断 。 这 些 都 是 基础 语法 , 掌 
握 的 语法 越 多 ,能 实现 的 功能 就 越 高 级 ,现在 这 还 是 个 很 烂 的 程序 ,如 果 你 试 着 运行 会 发 
现 , 这 段 程序 只 能 顺序 执行 到 底 , 比 如 英雄 选择 了 一 次 行进 方向 ,游戏 就 结束 了 ,没有 可 玩 
性 。 随 着 学 习 的 深入 ,可 以 考虑 新 学 到 的 知识 点 是 否 能 解决 你 已 经 设计 好 的 功能 。 等 学 完 
流程 控制 ,就 可 以 写 出 一 个 具有 可 玩 性 的 小 游戏 了 。 

养 成 从 全 局 考虑 问题 的 习惯 ,不 断 完善 自己 的 知识 体系 ,这 也 是 一 个 程序 员 的 自我 修 
养 。 在 实际 工作 中 总 是 会 有 新 的 知识 或 者 不 知道 的 技术 ,但 是 ,只 要 从 需求 出 发 ,其 他 的 无 
非 就 是 查 资料 、 看 文档 , 现 学 现 卖 也 好 ,快速 消化 新 知识 也 好 。 总 之 ,只 要 有 想法 ,技术 问题 
就 不 是 问题 。 


> 尼 入 掉 数据 的 标签 : 变量 


变量 一 词 来 源 于 数学 ,是 编程 语言 中 最 常见 的 组 成 部 分 ,用 来 表示 
计算 结果 或 表示 抽象 概念 。 变 量 可 以 用 来 表示 一 个 值 一 组 数据 一 个 
文件 ,甚至 另 一 个 程序 ,对 于 初学 者 来 说 ,基本 上 变量 就 是 一 个 值 ,可 能 
是 一 个 数字 ,也 可 能 是 一 串 字符 。 由 于 变量 能 够 把 程序 中 准备 使 用 的 
每 一 段 数据 都 赋 给 一 个 简短 或 易于 记忆 的 名 字 , 这 个 名 字 就 像 数 据 的 
标签 一 样 ,通过 名 字 就 可 以 得 到 对 应 的 数据 ,因此 十 分 有 用 。 变 量 的 值 
可 以 由 程序 员 直 接 赋 值 ,也 可 以 是 用 户 输入 的 数据 特定 运算 的 结果 以 及 一 个 内 涵 丰 富 的 
对 象 等 。 简 而 言 之 ,变量 是 用 于 跟踪 几乎 所 有 类 型 信息 的 简单 工具 。 


2.2.1 声明 变量 


声明 变量 也 叫 定义 变量 ,声明 变量 也 是 变量 赋值 的 过 程 ,这 个 过 程 就 是 给 变量 起 一 个 
名 字 , 然 后 给 它 一 个 数据 ,比如 英雄 的 血 值 : 





>>>hp = 100 


这 个 指令 的 作用 就 是 定义 一 个 名 字 为 hp 的 变量 ,通过 等 号 把 值 整数 100 赋 给 它 。 


fo 
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1. 变量 的 命 


一 个 好 的 程序 ,其 中 使 用 的 名 字 一 定 是 有 助 于 增加 程序 可 读 性 的 。 比 如 , 当 你 看 到 Pi 
这 个 名 字 时 就 会 想到 圆周 率 ;看 到 password 就 会 想到 密码 ,诸如 此 类 。 除 了 简洁 明了 之 外 ， 
Python 中 有 自己 的 命名 规则 ,下 面 的 命名 规则 通用 于 变量 名 、 函 数 名 、 类 名 等 。 

(1) 名 字 由 字母 ,数字 、 下 划 线 “_” 组 成 ,数字 不 能 作为 首 字符 。 

(2) 名 字 长 度 不 限 , 但 是 要 考虑 可 读 性 。 

(3) 严格 区 分 大 小 写 。 

(4) 不 要 使 用 Python 关键 字 ( 关 键 字 是 预先 保留 的 标识 符 ,每 个 关键 字 都 有 特殊 的 含 
义 )。 可 以 通过 下 面 的 指令 获得 Python 关键 字 信息 (不 同 版 本 可 能 会 有 区 别 ) 。 


>>> import keyword 

>>> keyword .kw1list 

['False', 'None', 'True', 'and', 'as', 'assert', 'break', 'class', 'continue', ‘'def', 
"del', 'elif', 'else','except', 'finally', 'for', 'from', 'global', "if', 'import', 
in ovr "ambdn sr nonlocal ly "not OF passr "False “return ne "Cr 
'while', 'with', 'yield'] 


此 外 ,在 命名 习惯 上 ,大 多 数 程序 员 更 习惯 于 驼峰 命名 法 ,驼峰 命名 法 比较 形象 ,是 复 
合 词 或 短语 的 常用 写法 ,单词 之 间 没 有 空格 和 下 划 线 。 单 词 通过 首 字母 大 写 进行 区 别 , 看 
起 来 就 像 驼峰 一 样 ,比如 ThisIsAnClass .myFunction。 除 第 一 个 单词 外 ,其 他 单词 首 字母 
大 写 叫 小 驼峰 ;把 第 一 个 单词 的 首 字母 也 大 写 叫 大 驼峰 。 在 Python 之 父 Guido 推荐 的 规 
范 中 ,类 命名 时 使 用 大 驼峰 ,但 是 模块 名 应 该 用 小 写 加 下 划 线 的 方式 ,如 lower_with_under. py。 
尽管 已 经 有 很 多 现存 的 模块 使 用 类 似 于 CapWords. py 这 样 的 命名 ,但 不 鼓励 这 样 做 , 因 
为 如 果 模 块 名 碰巧 和 类 名 一 致 ,会 造成 不 必要 的 困扰 。 由 于 编程 语言 众多 ,程序 员 转 来 
转 去 ,造成 风格 习惯 不 一 ,如 果 不 能 完全 做 到 统一 命名 ,至 少 在 自己 的 项 目 团队 中 保持 
统一 。 

另外 ,在 Python 中 以 下 划 线 ?开头 的 变量 具有 特殊 意义 ,在 明确 知道 其 意义 前 ,最 好 
不 要 以 下 划 线 “开头 (面向 对 象 章节 有 详细 讲解 )。Python 之 父 Guido 推荐 的 变量 命名 规 
范 如 表 2-1 所 示 。 


表 2-1 Guido 推荐 的 变量 命名 规范 

















类 型 公有 变量 私有 变量 
Modules lower_with_under _lower_with_under 
Packages lower_with_under 
Classes CapWords _CapWords 
Exceptions CapWords 
Functions lower_with_under() 


_lower_with_under() 





Global/Class Constants 


CAPS_WITH_UNDER 


_CAPS_WITH_UNDER 





Global/Class Variables 


lower_with_under 


_lower_with_under 





Instance Variables 





lower_with_under 


_lower_with_under (protected) or 





with_under (private) 


__lower_ 
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类 型 公有 变量 私有 变量 





I ith tected l 
Method Names lower_with_under() 区 人 人 ee 
with_under() (private) 





Function/ Method Parameters |lower_with_under 





Local Variables lower_with_under 








2. 赋值 
Python 的 赋值 符号 是 等 号 "一 ”, 赋 值 的 目的 就 是 将 名 字 和 值 关 联 起 来 ,比如 : 


x=1 
y=x+1 


虽然 使 用 的 是 等 号 ,但 是 不 同 于 数学 的 等 号 ,在 数学 计算 中 通常 左 侧 是 运算 , 右 侧 是 结 
果 , 而 程序 语言 中 的 赋值 操作 是 先 对 右 侧 表达 式 进 行 计算 ,再 将 结果 赋值 给 左 侧 变量 名 。 
事实 上 ,赋值 操作 不 改变 右 侧 的 任何 值 , 只 是 与 变量 名 建立 关联 关系 。 比 如 : 


x=1 
x=xXx+1 


这 个 例子 中 的 第 二 行 代码 在 数学 中 可 能 意义 不 大 ,但 是 在 程序 语言 中 却 很 有 用 ,比如 
实现 累加 的 效果 。 


222 变量 名 和 值 的 关系 


在 程序 中 我 们 通过 变量 名 访问 变量 值 ,表面 上 看 ,Python 中 的 变量 名 好 像 是 它 所 对 应 
数据 的 标签 一 样 ,这 个 标签 贴 到 哪个 数据 上 , 它 代表 的 就 是 什么 类 型 的 数据 , 换 一 种 解释 就 
是 变量 的 值 是 可 变 的 。 不 过 ,关于 变量 值 可 变 这 件 事 ,在 不 同 语言 中 是 有 区 别 的 ,比如 在 
C 语言 中 ,如 果 定 义 了 一 个 变量 并 且 声 明了 类 型 ,就 不 能 把 这 个 变量 的 值 更 改 为 其 他 类 型 ， 
而 在 Python 中 却 没有 任何 限制 。 在 本 书 中 如 果 没 有 特殊 说 明 , 提 到 变量 时 均 以 Python 
为 准 。 

Python 中 变量 名 和 值 是 标签 和 数据 的 关系 , 即 通过 标签 可 以 获取 它 所 代表 的 数据 。 假 
设 有 一 台 点 唱机 ,里 面 存放 着 成 千 上 万 首 歌曲 的 数据 ,每 首 歌 的 信息 量 都 很 大 , 当 你 想 点 歌 
时 ,并 不 需要 把 整 首 歌 的 歌词 都 输入 进去 ,你 只 需要 直接 输入 歌曲 的 名 字 就 可 以 找到 歌曲 
所 对 应 的 数据 ,那么 ,歌曲 名 字 就 相当 于 标签 , 它 所 关联 的 实际 就 是 点 唱机 里 面 歌曲 的 
数据 。 

现在 ,可 以 联想 一 下 标签 和 数据 其 实 存在 着 很 多 种 关系 。 比 如 点 一 首 歌 Hotel 
California ,点 唱机 就 会 找到 这 个 名 字 所 对 应 的 数据 ,这 就 是 一 对 一 。 然 后 有 人 点 了 《加 州 
旅馆 》, 点 唱机 播放 的 其 实 跟 刚 才 是 同一 首 歌 ,这 就 相当 于 一 个 数据 有 两 个 标签 , 即 多 对 一 。 
为 了 提高 音质 ,点 唱机 里 歌曲 的 源 文件 被 换 成 了 高 清 的 ,歌曲 的 名 字 这 个 标签 从 原来 的 文 
件 指向 到 了 新 的 文件 ,这 就 是 标签 的 可 移动 性 。 我 们 可 以 在 交互 环境 下 体验 这 些 效果 。 
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>>>X =1 
>>>y=1 
>>>print (x) 
>>>print (y) 
i 

>>>id(x) 
1792698496 
>>>id(y) 
1792698496 
>>>y = 2 
>>>id(y) 
1792698512 


这 个 例子 中 的 i4 〇 返回 的 是 对 象 在 内 存 中 的 地 址 ,值得 一 提 的 是 ,在 Python 中 一 切 都 
是 对 象 (如 果 你 想 深 入 理解 对 象 ,在 面向 对 象 编程 中 将 有 解释 )。 本 例 中 的 两 个 对 象 就 是 x 
和 y 两 个 整数 。 在 这 里 ,我 们 看 到 x 和 y 的 id 是 完全 一 样 的 ,这 是 Python 为 了 提高 内 存 利 
用 效率 ,对 于 一 些 简 单 的 对 象 , 如 一 些 数值 较 小 的 int( 整 数 ) 对 象 ,Python 采取 重用 对 象 内 
存 的 办 法 ,如 x= 一 1,y 一 1 时 ,由 于 1 作为 简单 的 int 类 型 且 数 值 小 ,Python 不 会 两 次 为 其 分 
配 内 存 , 而 是 只 分 配 一 次 ,然后 将 x 与 y 同 时 指向 已 分 配 的 对 象 ,这 就 相当 于 一 个 数据 有 两 
个 名 字 。 最 后 ,我们 给 y 重新 赋值 时 ,再 获取 的 内 存 地 址 就 变 了 ,这 就 是 标签 可 移动 (变量 
可 变 )。 

不 过 , 仅 通过 id 返回 的 内 存 地 址 来 判断 ,有 时 会 有 一 些 疑 惑 ,例如 : 


>>>x = 12345 
>>>y = 12345 
>>>id(x) 
61818192 
>>>id(y) 
61817488 
>>>x isy 
False 
>>>print (x) 
12345 
>>>print (y) 
12345 


表面 上 看 ,x 和 y 的 值 都 是 整数 12345 ,但 实际 在 内 存 分 配 上 却 不 是 一 个 数据 ,也 就 是 在 
内 存 中 存 了 两 个 12345。 通 过 身份 运算 符 is 可 以 判断 出 来 ,is 的 作用 是 判断 两 个 对 象 是 不 
是 一 个 ,如 果 是 , 则 返回 True; 如 果 不 是 , 则 返回 False。 不 过 ,程序 会 判断 x 和 y 的 值 是 一 
样 的 ,通过 x 和 y 都 可 以 获取 相同 的 数据 ,所 以 ,在 实际 编程 过 程 中 不 用 太 在 意 id。 

如 果 要 考虑 内 存 空 间 , 可 以 这 样 做 : 

>>>x = 12345 


>>>y =x 
>>>id(x) 
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61817744 
>>>id(y) 
61817744 
>>>x isy 
True 
>>>print (x) 
12345 
>>>print (y) 
12345 

>>>x = 56789 
>>>y 

12345 


在 这 里 ,y 和 x 的 id 相同 ,通过 身份 运算 符 is 判断 为 同一 个 对 象 。 我们 通过 y 二 x 对 y 
进行 赋值 ,实际 是 将 x 所 对 应 的 值 赋值 给 y。 但 是 ,不 要 误会 , 当 我 们 给 x 重新 赋值 后 ,y 是 
不 会 跟着 改变 的 ,因为 这 只 相当 于 把 x 这 个 标签 移动 到 了 新 的 数据 上 。 如 果 想 要 实现 x 变 
化 y 也 跟着 变 ,我 们 将 在 数据 类 型 列表 的 部 分 进行 讲解 。 


> 北 帮 汪 编写 可 以 跟 用 户 互动 的 程序 : 输入 、 处 理 和 输出 


通过 变量 ,可 以 方便 地 对 数据 进行 存储 或 者 关联 ,也 可 以 在 程序 内 
被 调用 。 但 是 很 多 时 候 ,针对 用 户 的 程序 经 常会 由 用 户 输入 数据 。 比 
如 《英雄 无 敌 ) 开 始 时 需要 玩家 输入 名 字 ,运行 中 需要 玩家 输入 行进 的 
方向 , 当 程 序 获取 到 玩家 输入 的 数据 时 ,再 在 程序 中 进行 相应 处 理 , 为 
了 让 玩家 有 直观 的 、 更 好 的 体验 ,程序 还 会 向 屏幕 输出 各 种 信息 。 这 就 
涉及 几乎 所 有 有 用 的 或 好 玩 的 程序 都 会 有 的 三 个 特征 : 输入 、 处 理 和 
输出 。 

下 面 通过 编写 一 个 简易 计算 器 程序 学 习 这 三 个 基本 要 素 。 在 这 个 例子 中 ,我 们 只 最 小 
限度 地 解决 问题 ,因为 实际 的 计算 器 程序 要 更 复杂 一 些 。 

(1) 输入 : 用 户 输 入 的 数字 和 运算 符 。 

(2) 处 理 : 程序 获取 用 户 的 输入 并 进行 相应 的 运算 。 

(3) 输出 : 程序 向 屏幕 打印 提示 和 结果 。 

注意 : 在 刚 开始 学 习 程 序 设计 时 ,可 以 先 最 小 化 需求 ,也 就 是 实现 最 基本 的 功能 ,然后 
再 不 断 完 善 。 不 要 追求 一 下 做 到 完美 ,因为 在 实际 工作 中 ,需求 是 不 断 变化 的 ,最 重要 的 是 
核心 功能 ,否则 就 会 每 天 疲 于 应 付 各 种 需求 的 变化 。 

找 出 了 核心 功能 ,用 能 想到 的 最 简单 的 方式 实现 。 至 于 更 复杂 的 功能 ,或 者 一 个 真正 
的 计算 器 , 随 着 学 习 的 深入 ,自然 而 然 就 能 完成 。 

(1) 获取 用 户 输入 的 数字 和 运算 符 。 解 决 这 个 问题 需要 使 用 input() 函数 ,这 个 函数 的 
作用 就 是 获取 键盘 输入 的 数据 和 运算 符 。 





编写 交互 式 程序 


>>>first = input() 
223 


fq 
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>>>print (first) 
123 

>>>second = input ('second int:') # 括 号 内 的 字符 串 会 被 打印 到 屏幕 上 
second int:456 
>>>print (second) 
456 

>>>first + second 
"123456" 

>>>type (first) 
<class 'str'> 
>>>type (second) 
<class 'str'> 


从 运行 结果 上 看 ,现在 的 结果 是 字符 串 拼 接 , 而 不 是 两 个 数字 相 加 。 出 现 这 个 结果 正 
是 因为 nput() 这 个 函数 , 它 的 作用 是 获取 键盘 输入 ,无 论 输 入 什么 内 容 ,保存 下 来 的 都 是 字 
符 串 。 通 过 类 型 判断 函数 type() 可 以 获取 数据 的 真实 类 型 。 

这 里 我 们 要 获得 的 是 整数 ,而 不 是 字符 串 。 通 过 int() 函数 做 类 型 转换 。 


>>>first = int(input()) ， #int() 作 用 是 将 其 他 类 型 转换 为 整数 
123 

>>>type (first) 

<clase int.> 


(2) 程序 内 部 处 理 数据 并 输出 给 用 户 。 有 了 数字 ,内 部 运算 就 是 把 想法 通过 代码 实现 
的 过 程 。 在 学 习 怎 样 判 断 之 前 ,我 们 让 程序 直接 进行 加 \ 减 ,乘除 运算 。 为 了 让 用 户 有 更 
好 的 体验 ,可 以 润色 一 下 ,比如 等 待 用 户 输入 数据 时 不 是 黑屏 ,打印 结果 时 有 一 些 提示 , 具 
体 程 序 如 下 : 


#jisuanqi-0.1.py 
irst = intiinpat (teirst:)) 
second = int (input ('second:')) 


print('"+", result is :', first + second) 
Print ("= ", result 49 227. first =.Ssecond) 
print('"*", result is :', first * Second) 
print('"/", result is :', first / second) 


运行 结果 如 下 : 


first:1 

second:2 
3 
= esUlt 4 :=1 
2 
mm ralt ts OS 
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> 攻心 快速 理解 对 象 和 类 型 : 数字 和 字符 串 


前 面 我 们 提 到 ,Python 中 一 切 都 是 对 象 ,那么 ,对 这 些 值 进行 操作 即 是 对 这 些 对 象 进行 
操作 。 每 个 对 象 都 有 与 之 对 应 的 类 型 ,这 些 对 象 其 实 就 是 某 种 类 型 的 一 个 实例 。 例 如 ,1、 
2、12345 是 整数 (Int) 类 型 的 对 象 ;3. 1415926 是 浮 点 数 (Float) 类 型 的 对 象 ;'hello' 'world' 是 
字符 串 (String) 类 型 的 对 象 ; 还 有 结构 型 数据 、 列 表 、 元 组 ,字典 等 。 在 后 续 章 节 中 ,会 系统 
学 习 数 据 类 型 以 及 自 定义 的 类 。 

初学 Python, 明 确 对 象 的 类 型 很 关键 ,因为 类 型 决定 了 对 于 这 个 类 型 的 对 象 ,有 哪些 操 
作 是 合法 的 、 允 许 的 ,以 及 操作 的 结果 是 什么 。 

程序 语言 中 的 数据 与 现实 世界 是 相通 的 ,Python 提供 了 丰富 的 数 
据 类 型 ,初期 我 们 用 得 最 多 的 就 是 数字 和 字符 串 , 因 为 Python 中 的 数 
字 类 型 与 我 们 熟悉 的 数学 概念 是 相对 应 的 ,所 以 可 以 通过 数字 做 一 些 
适应 性 练习 。 

与 数学 对 应 的 ,Python 3 的 数字 分 为 整数 、 浮 点 数 (小 数 ) 和 复数 
( 虚 部 用 j 标识 )。Python 2 还 有 一 个 长 整 型 ,不 用 太 在 意 长 整 型 ， 
Python 3 将 其 取消 是 有 道理 的 ,因为 长 整 型 其 实 就 是 一 串 比 较 长 的 整数 。 





数据 类 型 : 数字 





>>>x = 123 # 整 型 
>>>y = 1.23 # 浮 点 型 
>>>z = 1+ 23j # 复 数 型 
>>>type (x) 

<class 'int'> 
>>>type (y) 

<class 'float'> 
>>>type (z) 

<class 'complex'> 


前 面 在 讲 变 量 时 已 经 定义 了 一 些 数值 ,不 过 ,我 们 做 运算 时 所 获取 到 的 值 ,Python 如 何 
知道 是 数字 1 和 12345 ,而 不 是 字符 串 4 和 '12345' 呢 ? 比如 input() 获 取 到 的 数字 组 成 的 字 
符 串 。 

聪明 的 你 可 能 已 经 发 现 了 ,我 在 写 代 码 的 时 候 就 已 经 有 区 别 了 ,就 是 引号 。 不 错 ， 
Python 就 是 通过 这 样 一 些 符 号 来 做 区 分 的 ,你 可 以 试 着 做 一 个 加 法 看 看 类 型 不 同 所 得 到 的 
结果 。 


>>>x +x 
111' 


看 出 区 别 了 吗 ? 不 加 引号 的 加 法 运算 ,将 x 作为 数字 处 理 , 得 到 的 就 是 正常 的 数学 运 
算 结 果 , 而 加 了 引号 的 字符 串 1', 加 在 一 起 构成 的 还 是 一 个 字符 串 ,结果 是 把 两 个 字符 拼接 
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在 一 起 。 


运算 符 和 表达 式 


通过 前 面 数 字 的 例子 ,我 们 已 经 看 到 了 简单 的 算术 运算 ,Python 
其 实 就 是 一 个 计算 器 ,只 要 你 能 想到 的 , 它 都 可 以 完成 。 这 并 不 是 说 
数学 家 发 明了 Python, 而 是 因为 数学 真 的 无 处 不 在 ,特别 是 编程 领域 
一 直 与 数学 密 不 可 分 。 平 时 总 会 有 人 问 诸 如 英语 不 好 能 不 能 学 编程 
这 样 的 问题 ,其实 相 比 英语 ,数学 更 加 重要 。 毕 竟 程 序 语 言 用 到 的 关 
键 字 很 有 限 ,完全 可 以 用 拼音 当 变 量 名 字 , 可 是 数学 却 不 能 替代 , 解 
决 数学 问题 与 编程 有 着 相同 的 逻辑 思维 关系 。 

其 实数 学 运算 就 是 将 各 种 元 素 通 过 运算 符 组 成 表达 式 ,最 终 得 到 一 个 结果 。Python 中 
的 运算 符 分 为 算数 .赋值 比较、 逻辑 等 。 表 达 式 就 是 将 不 同 的 数据 (包括 变量 ,函数 ) 用 运 
算 符 按 一 定 的 规则 连接 起 来 的 式 子 。 


2.5.1 算术 运算 符 
数学 运算 首要 的 就 是 四 大 基本 运算 加 、 减 乘 、 除 了 ,分 别 对 应 的 符号 如 下 。 





>>>1 +1 # 加 

2 

>>>5 -3 # 减 

2 

>>>1 * 2 # 乘 

2 

> 52 # 除 
2 

>>>57/2 # 整 除 


2 


这 个 例子 是 在 Python 3 中 的 结果 ,如 果 是 在 Python 2 中 ,有 个 陷阱 就 是 5/2 的 结 
果 为 2, 它 会 认为 整数 做 除法 ,结果 也 要 是 整数 。 在 Python 2 中 还 专门 有 一 个 模块 用 来 
解决 这 种 问题 ,Python 3 已 经 不 需要 了 ,在 Python 2 中 可 以 这 样 解决 这 个 问题 : 


>>>5.0/2 
2.5 


除了 加 , 减 、 乘 、 除 ,Python 还 支持 指数 运算 和 求 余 , 如 下 所 示 。 


2 #2 的 3 次 方 
8 
>>>8 $3 #8 模 3 余 2 
2 
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2.5.2 赋值 运算 符 
有 了 运算 结果 ,我 们 会 保留 下 来 : 


>>>x =1+2*#5 
>>>print (x) 
有 


这 里 就 相当 于 变量 赋值 ,等 号 右 侧 先 进行 计算 ,最 终结 果 赋 值 给 左 侧 。 同 时 也 可 以 看 
到 上 面 的 运算 优先 级 跟 数 学 运算 优先 级 是 一 样 的 ,也 可 以 : 


>>>x = (1+2) * 5 
>>>print (x) 
15 


另外 ,赋值 运算 符 在 程序 语言 中 有 一 种 有 意思 的 用 法 ,如 下 所 示 。 


>>>x = 1 
>>>X =x+1 
>>>print (x) 
2 


上 述 代 码 的 意思 是 变量 x 自身 加 1, 即 自 加 , 自 加 在 Python 中 有 专门 的 运算 符 十 一 ,如 
下 所 示 。 


>>>x =1 

>>>x +=1 

>>>print (x) 

2 

除了 自 加 ,还 有 自 减 、 自 乘 、 自 除 …… 如 下 所 示 。 
>>>x = 10 

>>>x -= 6 


>>>print (x) 
4 

>>>x = 10 
>>>x *=2 
>>>print (x) 


20 

>>>x = 10 
>>>x /= 2 
>>>print (x) 
5.0 

>>>x = 10 
>>>x $=3 


>>>print (x) 
下 
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>>>X =2 
>>>X 关 x*=3 
>>>print (x) 
8 
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2.5.3 比较 运算 符 


在 编程 过 程 中 ,经 常会 通过 比较 一 些 数据 来 做 判断 ,这 时 就 会 用 到 比较 运算 符 ,而 且 
通常 会 配合 判断 语句 使 用 ,因为 比较 的 结果 只 有 成 立 和 不 成 立 ,在 编程 语言 中 称 为 真 和 
假 , 用 True 和 False 表示 ,True 和 False 属于 布尔 类 型 ,术语 叫 布尔 值 。 比 较 运 算 符 用 法 


如下: 


>>>a = 10 
>>>b = 20 
>>>a ==b 
False 
>>>a !=b 
True 
>>>a <b 
True 
>>>a > b 
False 
>>>a <=b 
True 
>>>a >=b 
False 


#a 是 否 等 于 b 


#a 是 否 不 等 于 b 


#a 是 否 小 于 b 


#a 是 否 大 于 b 


#a 是 否 小 于 等 于 b 


#a 是 否 大 于 等 于 b 


2.5.4 逻辑 运算 符 和 布尔 值 


在 比较 运算 符 中 ,我 们 知道 了 布尔 值 ,其 实 ,除了 True 和 False 还 有 其 他 类 型 的 值 , 计 
算 机 也 会 处 理 为 True 和 False, 比 如 None、0、 所 有 空 的 值 ( 空 字符 串 、 空 列表 等 ) 都 为 False， 


其 余 均 为 True。 


逻辑 运算 符 有 三 个 ,如 表 2-2 所 示 ( 表 中 实例 的 前 提 为 a 二 10,b = 20)。 


表 2-2 逻辑 运算 符 




















运算 符 | 逻辑 表达 式 描 述 实 例 
ee ee et 如 果 x 为 False,xand y 返回 False; 和 否则 ,返回 y (a and b) 返回 20 
BE jE 沙 Mn 如 果 x 是 非 0, 返 回 x 的 值 ;否则 ,返回 y 的 计算 ta ol by 运 回首 

布尔 " 非 ": 如 果 x 为 True, 返 回 False; 如 果 x 为 False, 返 |not(a and b) 返回 
not not x 
回 True False 


2.5.5 成 员 运 算 符 
Python 还 支持 成 员 运算 符 ,用 于 判断 序列 中 是 否 存在 指定 的 值 ,用 法 如 下 。 


条 
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> Tn Ry #'xyz' 字 符 串 中 是 否 含有 字符 'x' 
True 

>>> 'x' not in 'xyz' #'xyz' 字 符 串 中 是 否 不 含 字 符 'x' 
False 

>>> 


2.5.6 其 他 运算 符 


除 以 上 提 到 的 运算 符 之 外 ,Python 还 包括 在 2. 2. 2 小 节 中 提 到 的 身份 运算 符 is 和 is 
not( 见 表 2-3) 以 及 以 二 进 制 方式 运算 的 位 运算 符 ( 位 运算 符 本 书 不 涉及 ,这 里 就 不 多 介 
绍 了 )。 








表 2-3 身份 运算 符 
运算 符 描 述 实 例 
骨 判断 两 个 标识 符 是 不 是 引用 自 一 个 |xis y, 类 似 id(x) 一 = id(y) 。 如 果 引 用 的 是 同一 个 
和 对 象 对 象 , 则 返回 True; 否 则 ,返回 False 
二 判断 两 个 标识 符 是 不 是 引用 自 不 同 |xis not y, 类 似 id(a) != id(b)。 如 果 引 用 的 不 是 同 
对 象 一 个 对 象 , 则 返回 True; 和 否则 ,返回 False 








2.5.7 运算 符 优先 级 
表 2-4 列 出 了 从 最 高 到 最 低 优 先 级 的 所 有 运算 符 。 
表 2-4 运算 符 及 其 优先 级 












































运算 符 描 述 优先 级 顺序 
关 共 指数 最 高 
po 按 位 翻转 、 一 元 加 号 和 减 号 (最 后 两 个 的 方法 名 为 十 @ 
和 一 @) 
# 乘除 , 取 模 和 取 整 除 
;es 加 法 ,减法 
>> << 右 移 、 左 移 
& 位 'AND' 
| 位 运算 符 
<= < > >= 比较 运算 符 
二 .Ns 等 于 .不 等 于 运算 符 
“人 ”| 同人 运算 从 
is is not 身份 运算 符 
in notin 成 员 运 算 符 | 
not or and 逻辑 运算 符 最 低 
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如 何 快速 获取 帮助 


在 前 面 的 章节 介绍 了 如 何 提问 和 获取 帮助 ,但 远 水 解 不 了 近 渴 。 比 如 ,这 么 多 运算 符 ， 
怎么 没有 正弦 、 余 弦 呢 ? 别 急 ,我 们 已 经 知道 Python 具有 丰富 的 模块 ,关于 数学 运算 就 有 
一 个 math 模块 ,math 模块 中 提供 了 丰富 的 数学 运算 方法 ,正弦 余弦 都 是 小 意思 。 如 果 想 
知道 模块 中 提供 了 哪些 方法 ,可 以 通过 dir() 函数 得 到 


>>>dir (math) 

{doc "';" lo0oader '" name ";" package "sr" Spec "'; "acos's 'acosh's 
'asin', "asinh' 'atan', "atan2', 'atanh', 'ceil', 'copysign', ‘'cos', 'cosh', 
'degrees', 'e', 'erf', 'erfc', 'exp', 'expml', 'fabs', 'factorial', 'floor', 'fmod', 
"frexp', 'fsum', 'gamma'’, 'gcd', 'hypot', 'inf'", 'isclose', 'isfinite', 'isinf', 
"isnan', "ldexp', 'lgamma', 'l0g', 'l10g10', 'loglp', 'l10g2', 'modf', 'nan', 'pi', 
POW "radiansr ‘sin.y “sinh “sqrt!r "tan's "tanl yy "Eau "trunc] 

>>> 


这 个 办 法 可 以 直观 地 看 到 math 模块 提供 的 方法 有 哪些 ,你 看 到 'sin' 和 'cos' 了 吧 。 
当然 ,你 可 能 还 需要 其 他 方法 ,或 者 希望 更 详细 地 了 解 这 些 方法 怎样 使 用 ,这 时 就 可 以 
使 用 Python 中 最 强大 的 私人 助手 help() 了 ,用 法 如 下 。 


>>>help (math) 
Help on built- in module math: 


NAME 
math 


DESCRIPTION 
This module is always available. It provides access to the 
mathematical functions defined by the C standard. 


FUNCTIONS 
acos(...) 
acos (x) 


Return the arc cosine (measured in radians) of x. 


省 略 几 百 行 


cos(...) 
cos (x) 


Return the cosine of x (measured in radians). 


sin(...) 
sin(x) 


A 
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Return the sine of x (measured in radians) . 


省 略 几 百 行 


DATA 
e= 2.718281828459045 
inf = inf 
nan = nan 
pi = 3.141592653589793 
tau = 6.283185307179586 


FILE 
(built- in) 


在 这 个 显示 结果 中 可 以 看 到 完整 的 帮助 手册 ,其 中 省 略 的 上 百 行 内 容 都 是 关于 方法 的 
使 用 说 明 , 可 以 看 到 sin() 和 pi, 最 后 的 DATA 是 属性 。 用 的 时 候 要 注意 ,因为 这 些 都 属于 
math 模块 ,所 以 调用 时 采用 点 分 法 ,就 像 前 面 用 过 的 turtle 模块 绘图 : 


>>>import math 
>>>print (math .pi) 
3.141592653589793 
>>>math.sin(1) 
0.8414709848078965 


看 到 这 里 ,你 有 没有 明确 一 件 事 ? 当 我 们 用 到 不 熟悉 的 模块 时 ,不 必 去 网 上 查找 资料 ， 
直接 用 help() ,基本 就 可 以 解决 问题 了 。 

注意 : 使 用 help() 是 初学 者 必须 适应 和 习惯 的 事情 ,通常 可 以 获得 第 一 手 资料 ,而 且 是 
最 快捷 、 最 权威 的 资料 。 


[> 及: 帮 有 形 蛋 : 打印 正弦 波 


在 学 习 基 础 内 容 时 就 能 看 到 相关 应 用 的 最 简 示 例 对 学 习 编程 语言 是 非常 有 帮助 的 ,要 
不 然 , 你 学 了 数字 和 运算 总 会 问 : 这 能 干什么 ?就 做 个 加 减 乘除 ? 

打印 正弦 波 这 个 例子 涉及 科学 计算 和 数据 可 视 化 技术 ,说 得 高 科技 一 点 , 跟 深度 学 习 
还 能 扯 上 关系 ,按照 忽悠 性 培训 机 构 的 说 法 “这 节 课 我 们 学 习 人 工 智能 的 相关 案例 ”。 

这 里 我 们 需要 用 到 两 个 模块 : numpy 和 matplotlib。 如 果 你 的 环境 中 没有 ,使 用 pip 安 
装 就 可 以 了 。 

1. Python 的 科学 计算 包 一 一 numpy 


numpy(numerical python extensions) 是 一 个 第 三 方 的 Python 包 , 需 要 额外 安装 ( 见 
图 2-1) ,用 于 科学 计算 。 这 个 库 的 前 身 是 1995 年 就 开始 开发 的 一 个 用 于 数组 运算 的 库 。 
经 过 长 时 间 的 发 展 ,基本 上 成 了 Python 科学 计算 的 基础 包 , 当然 也 包括 所 有 提供 Python 
接口 的 深度 学 习 框 架 。 


© 
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安装 及 导入 过 程 如 图 2-1 所 示 。 











图 2-1 numpy 的 安装 及 导入 


注意 :在 导入 numpy 时 ,可 以 将 np 作为 numpy 的 别名 。 这 是 一 种 习惯 性 的 用 法 。 
2. Python 的 可 视 化 包 一 一 matplotlib 


matplotlib 是 Python 中 最 常用 的 可 视 化 工具 之 一 ,可 以 非常 方便 地 创建 海量 类 型 的 
2D 图 表 和 一 些 基 本 的 3D 图 表 。matplotlib 最 早 是 为 了 可 视 化 癫 痢 病 人 脑 皮层 电 图 相关 的 
信和 号 而 研发 的 ,因为 在 函数 的 设计 上 参考 了 MATLAB, 所 以 叫 作 matplotlib 。matplotlib 首 
次 发 表 于 2007 年 ,在 开源 和 社区 的 推动 下 ,现在 在 基于 Python 的 各 个 科学 计算 领域 都 得 
到 了 广泛 的 应 用 。matplotlib 的 原作 者 John D. Hunter 博士 是 一 名 神经 生物 学 家 ,2012 年 
因 癌 症 去 世 。 

安装 matplotlib 的 方式 和 numpy 一 样 ,通过 pip 安装 就 可 以 : 


>>pip install matplotlib 


3. 2D 图 表 
matplotlib 中 最 基础 的 模块 是 pyplot。 这 里 可 用 来 画 点 图 和 线 图 ,用 法 如 下 。 





>>> Import matplotlib.pyplot as plt 
最 终 画 正弦 图 的 代码 如 下 : 


nunsin 0.1.py""" 
import numpy as np 

import matplotlib.pyplot as plt 

x=np.arange (0,2x*xnp.pi,0.01) # 设 定 x 的 取 值 范围 ,从 0 到 2x, 以 0.01 步 进 
y= np.sin (x) 


plt.plot (x,y) # 画 模型 的 图 ,plot 函数 默认 画 连 线 图 
Plt.show() # 让 画 好 的 图 显示 在 屏幕 上 

















效果 如 图 2-2 所 示 。 





图 Figure1 = 口 六 














0 全 4 6 8 10 12 


全 |€| 了 | 中 |Q| 扩 | 
图 2-2 程序 运行 结果 


这 就 是 科学 计算 加 数据 可 视 化 的 一 个 简单 实现 , 想 做 更 多 事 ,无 非 就 是 数据 和 方法 的 
结合 罢了 。 


| 吕 重点 提示 


在 这 一 章 中 ,你 要 掌握 的 内 容 : 

(1) 初步 培养 全 局 考虑 问题 的 意识 。 
(2) 掌握 变量 的 定义 和 数据 类 型 的 概念 。 
(3) 理解 输入 、 处 理 和 输出 。 

(4) 理解 对 象 和 类 型 。 

(5) 了 解 运算 符 及 使 用 方法 。 

(6) 掌握 快速 获取 帮助 的 方法 。 


3 动 动手 


(1) 以 交互 形式 打印 用 户 输入 的 个 人 信息 ,比如 用 户 分 别 输入 名 字 、 性 别 、 身 高 、 年 龄 
等 ,经 程序 处 理 后 输出 。 

(2) 由 用 户 输入 两 个 数字 ,程序 分 别 对 这 两 个 数字 做 加 、 减 、 乘 、 除 四 则 运算 ,如 果 遇 到 
屏幕 上 有 错误 提示 ,尝试 找到 原因 (如 果 不 太 明白 要 做 什么 ,可 以 学 完 下 一 章 再 做 )。 

(3) 书店 所 有 书 打 6 折 销 售 ,运费 一 本 6 元 ,每 多 加 一 本 运费 加 一 元 ,用 户 输入 要 买 的 
书籍 的 单价 以 及 购买 的 数量 ,屏幕 输出 总 价 。 试 编写 程序 实现 。 
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字符 串 是 编程 语言 中 用 到 最 多 的 数据 类 型 ,许多 实际 问题 的 处 理 , 最 后 都 变 成 了 字符 
串 的 问题 。 以 人 英雄 无 敌 ) 为 例 ,作为 一 个 纯 文 字 的 游戏 , 若 想 让 开场 有 些 气势 ,运行 的 过 程 
中 更 生动 有 趣 ,都 需要 围绕 字符 串 来 做 文章 。 其 他 诸如 网 络 数据 传输 、 传 递 网 址 、 发 微 博 
等 ,只 要 跟 数 据 有 关 的 基本 都 与 字符 串 相关 。 
例如 怎么 实现 图 3-1 所 示 的 互动 效果 ? # 号 的 方 框 是 怎么 出 来 的 ? 
please input your na 


pPLease input your 
拉 拉 拉 拓 失 拓 拉 拓 拉 拓 拓 拓 拓 拉 拉 撞 失 


拉 排 拓 排 排 枯 排 振 拓 拓 排 拓 排 拓 拓 拓 拓 拓 拓 拉 拓 基 撞 拉 拓 





3-1 互动 效果 
代码 如 下 。 


DPI 斌 nn 七 (" 提 提 提 提 扩 扩 提 提 提 提 提 六 失 拉 提 提 提 提 提 扩 拓 提 提 并 提 提 并 并 并 ) 
Print("#welcome to milo's tool box #") 
Print ("#1 : 1s # 
print ("#2 : free 


print ("#3 : quit 四 
Kint ("### 拓 大大 提 拓 拓 并 拓 大 提 提 并 拓 拓 并 拓 埋 提 拓 拓 并 # 拓 拓 


nm 


) 
) 
) 
) 


扩大 太 


上 述 代码 可 以 实现 图 3-1 的 效果 ,但 不 止 于 此 ,关于 字符 串 可 以 研究 的 太 多 了 。 接 下 来 
我 们 将 介绍 关于 字符 串 的 知识 。 


> 于 为 图 字符 串 的 基本 定义 


字符 串 是 一 个 序列 ,程序 语言 中 认为 可 以 打印 的 字符 序列 就 是 字 
符 串 。 这 个 序列 不 一 定 是 一 个 单词 , 它 可 以 是 一 串 密码 123456 、 一 个 
网 址 ,甚至 是 任意 的 组 合 ,比如 abc、 一 篇 完整 的 博客 或 者 一 个 程序 的 
所 有 源 代码 。 

在 Python 中 构建 一 个 字符 串 ,或 者 定义 一 个 字符 串 有 两 种 方法 。 





rT 


字符 串 定义 和 操作 
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一 种 是 通过 内 建 函 数 str() 生 成 ,str() 实 际 是 类 型 内 置 函数 , 与 整数 int() 一 样 ,用 法 
如 下 。 


>>>s = 123 
>>>type(s) 
<class 'int'> 
>>>s+s 

246 

>>>s = str(s) 
>>>type(s) 
<class 'str'> 
>>>s+s 
E22 


另 一 种 更 常用 、 也 最 直接 的 方法 是 通过 引号 定义 , 单 、 双 引号 都 可 以 ,只 要 成 对 出 现 就 
行 , 用 法 如 下 。 
>>>h = "hello" 


>>>w = 'world' 
>>>hw = 'hello world" # 错 误 用 法 


Python 对 字符 串 的 单 、 双 引号 没有 要 求 , 但 实际 上 双 引 号 用 起 来 会 更 方便 一 些 ,比如 
"let's go" ,如 果 使 用 单 引 号 则 需要 对 字符 串 中 的 单 引号 做 转 义 处 理 'let\ 's go'。 


311 转 义 字符 


在 引号 前 加 \ ,可 将 其 后 的 符号 转 为 普通 字符 处 理 , 转 义 字 符 不 会 计 入 字符 串 , 即 打印 
!et\'s go' 的 效果 是 这 样 的 : 


>>>print ('let\'s go') 
let's go 


利用 转 义 字符 可 以 实现 更 多 的 打印 效果 , 表 3-1 为 Python 中 的 转 义 字符 。 


























表 3-1 转 义 字符 
转 义 字符 描 述 描 述 
\( 在 行 尾 时 ) | 续 行 符 换行 
\ 反 斜 杠 符号 纵向 制 表 符 
妈 单 引 号 横向 制 表 符 
Y 双 引 号 回 车 
\a 响 锥 换 页 
\b 退 格 (Backspace) A 代表 的 字符 ,例如 ,\ol2 
和 十 六 进 制 数 ,yy 代表 的 字符 ,例如 ， 
让 \xoe 代 表 换行 
\000 空 其 他 字符 以 普通 格式 输出 
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有 了 转 义 字符 就 可 以 打印 这 样 的 内 容 : 


>>>say = "tom: \"let\'s go ! \" \njerry:'ok'™" 
>>>print (say) 

Coms “let "gs go ye 

jerry: 'ok' 


312 Docstring 


通过 转 义 字符 可 以 控制 输出 的 样式 ,但 是 并 不 方便 ,试想 要 给 一 大 段 文章 添加 转 义 字 
符 , 那 是 很 辛苦 的 。 幸 好 在 Python 中 还 有 一 种 选择 ,就 是 Docstring ,三 种 引号 定义 字符 串 。 

通过 一 对 三 个 单 引 号 或 者 双 引 号 定义 字符 串 ,效果 即 在 编码 时 看 到 的 就 是 输出 效果 ， 
而 不 必 再 使 用 转 义 字符 。 前 面 例子 的 字符 串 可 以 这 样 定 义 : 


>>>say = """tom: "let's go!" 
Trey 

>>>print (say) 

tom: "let's go!" 

EY 

>>>say 

'tom: "let\'s go!"\njerry:"ok" ' 


这 里 我 们 在 定义 字符 串 时 就 是 按照 显示 的 状态 编写 的 ,输出 时 保持 了 一 样 的 效果 ,并 
没有 使 用 转 义 字符 ,但 实际 在 保存 时 ,输入 的 回 车 、 缩 进 等 都 会 以 转 义 字符 的 形式 被 保存 
下 来 。 

三 引号 的 好 处 除了 可 以 让 代码 看 起 来 更 整洁 以 外 ,另外 一 个 作用 就 是 在 前 面 讲 注释 时 
所 提 到 的 作用 : 可 以 通过 三 引号 对 程序 做 注释 。 


3.1.3 ”原始 字符 串 


通过 三 引号 字符 配合 可 以 定义 出 想 要 的 字符 串 , 不 过 有 时 我 们 和 希望 转 义 字符 被 当 作 普 
通 符号 出 现 而 不 具备 特殊 含义 , 则 需要 将 字符 串 定义 为 原始 字符 串 ,否则 就 很 麻烦 。 我 们 
在 定义 正则 表达 式 时 经 常 使 用 原始 字符 串 ,方法 就 是 在 字符 串 前 加 字母 r, 用 法 如 下 。 


>>>s = "a \n b" 
>>>print (s) 
a 
b 
>>>s = "a \\n b" # 转 义 转 义 字符 ,多 的 时 候 操作 不 便 
>>>Print(s) 
a nb 
>>>s =r"a \n b" # 定 义 原 始 字符 串 
>>>Print(s) 
a\nb 
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314 Unicode 字符 串 


字符 串 中 如 果 含 有 中 文 ,特别 是 不 同 的 系统 采用 不 同 的 中 文 编码 ,如果 不 是 Unicode 编 
码 ,也 会 比较 麻烦 ,可 能 需要 一 次 取 两 个 或 三 个 字符 才能 显示 一 个 中 文 。 所 以 如 果 涉 及 中 
文 , 建 议 将 字符 串 定义 为 Unicode 字符 串 , 只 需要 在 字符 串 前 加 U 或 u, 用 法 如 下 。 


>>>hw = u" 你 好 hello" 
>>>hw[0] 


+" 你， 


> 下 雹 用 序列 


字符 串 当中 的 字符 是 有 序 排列 且 顺 序 不 可 变 的 ,其 中 每 个 字符 对 。 国生 3 
象 都 可 以 通过 索引 单独 获 了 到。 同样 具有 这 种 特性 的 还 有 列表 和 元 组 ， 中 
只 是 对 象 从 字符 串 变 成 了 更 丰富 的 形式 。 我 们 先 通过 字符 串讲 解 一 下 站 
序列 的 特性 和 基本 操作 ,列表 和 元 组 操作 方法 相同 。 a: 


3214 索引 pr 


索引 ( 见 图 3-2) 可 以 理解 为 字符 串 中 每 个 字符 的 编号 , 正 序 是 从 左 到 右 ,起 始 数字 为 0; 
倒序 是 从 右 向 左 ,起 始 数字 为 一 1。 
P|YlTlH1|oIlINN 


0 1 2 3 4 5 
6 5 4 3 2 1 










































3-2 索引 
获取 字符 串 内 元 素 的 方式 : 字符 串 对 象 后 加 方 括号 , 方 括号 内 加 索引 ,用 法 如 下 。 


>>>s = "PYTHON" 
>>>s [0] 
pr! 
>>>s [3] 
‘Hr! 
>>> 8 =1] 
ANY 
>>>s[- 6] 
pr 
>>>s[- 7] # 索 引 越界 
Traceback (most recent call last): 

File "<pyshell#11>", line 1, in <module> 
s[- 7] 
IndexError: string index out of range 
>>>s[6] 
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Traceback (most recent call last) : 
File "<pyshell#12>", line 1, in <module> # 出 错 代码 位 置 
s[6] 
IndexError: string index out of range # 异 常 类 型 及 提示 信息 


需要 注意 的 是 索引 越界 问题 ,超出 索引 界限 就 会 抛 出 异常 。 这 是 本 书 讲解 中 第 一 次 遇 
到 异常 ,可 能 在 前 面 的 练习 中 你 也 遇 到 过 ,通常 重要 信息 就 是 最 后 一 行 的 异常 类 型 和 出 错 
代码 位 置 。 通 过 异常 信息 ,大 多 数 时 候 我 们 可 以 很 方便 地 找到 问题 所 在 。 

注意 : 你 可 以 在 开始 学 习 时 试 着 记 下 这 些 异 常 类 型 ,见得 多 了 你 就 会 发 现 ,翻来覆去 的 
就 是 那 几 个 类 型 。 异 常 是 计算 机 跟 你 对 话 的 途径 ,能 够 帮 你 快速 发 现 问题 ,具体 可 以 看 
第 10 章 异 常 处 理 。 


322 切片 


切片 也 叫 分 片 ,功能 相当 强大 ,用 于 截取 某 个 范围 内 的 元 素 ,通过 [起 始 值 : 结束 值 ] 来 
指定 起 止 区 间 ( 左 闭 右 开 区 间 ,包含 左 侧 索引 值 对 应 的 元 素 ,但 不 包含 右 侧 索引 值 对 应 的 元 
素 )。 这 种 切片 操作 很 多 时 候 会 节省 大 量 的 代码 ,而 且 很 方便 ,比如 从 一 个 长 字符 串 中 获取 
一 个 单词 ,用 法 如 下 。 


>>>hw = "hello world" 
>>>hw[0:5] 

'hello' 

>>>hw[:5] 

"hello'" 

>>>hw[6:11] 

"world' 

>>>hw[6:] 

"world' 


上 述 例子 中 如 果 不 指定 起 始 值 , 则 切片 会 取 到 起 始 位 置 ; 如 果 不 指 定 结束 值 , 则 切片 会 
取 到 结束 位 置 。 若 都 不 指定 ,你 自己 试 一 下 : 


>>>hw[:] # 试 一 下 ,自己 看 结果 吧 


除了 正 向 切片 ,负数 的 反 向 切片 一 样 可 以 ,上 面 的 例子 就 变 成 : 


>>>hw = "hello world" 
>>>hw[-11:-6] 
'hello' 

>>>hw[:-6] 


"hello'>>>hw[-5:-1] # 这 个 取 不 到 结尾 , 想 想 为 什么 ? -1 换 成 0 呢 ? 


"wor1 


在 切片 时 加 入 第 三 个 参数 ,作用 是 指定 步 长 值 ,默认 是 1, 即 前 面 的 例子 中 没有 指定 步 
长 值 , 步 长 值 就 都 是 1。 用 法 为 


[起 始 值 : 结束 值 : 步 长 值 ] : 


oi 











Python 快速 入 门 精 讲 








>>>hw = "hello world" 
>>>hw[::1] 

"hello world' 
>>>hw[::2] 

"hlowrd' 

>>>hw[::-1] 

"dlrow olleh' 


关于 步 长 ,你 可 以 理解 为 在 序列 中 取 值 时 ,有 个 小 人 从 左 向 右 走 , 它 默认 是 走 一 步 取 一 
个 元 素 ,你 指定 了 步 长 值 后 就 会 按 指定 的 步 长 值 运行 ,有 意思 的 是 步 长 值 为 一 1 时 ,相当 于 
改变 了 取 值 的 方向 ,从 右 向 左 取 。 

在 数字 中 使 用 步 长 ,还 可 以 实现 获取 奇偶 数 的 效果 : 


>>>x = "0123456789" 
>>>x[::2] 

"02468 

>>>x [1*:2] 

33STOY 

>>>X :10 
'9876543210' 


有 了 切片 功能 ,你 可 以 用 在 (英雄 无 敌 ) 里 存储 英雄 的 各 项 信息 ,用 空格 分 开 , 然 后 通过 
切片 获取 其 中 的 一 部 分 ,比如 英雄 的 名 字 。 当 然 , 这 样 操作 会 很 麻烦 。 解 决 的 办 法 就 是 用 
列表 存储 数据 ,这 个 在 第 5 章 列表 和 元 组 再 介绍 。 


> 于 起 习 与 字符 串 相 关 的 运算 符 


之 前 我 们 罗列 了 Python 中 常用 的 运算 符 ,这 一 节 讲 其 中 涉及 字符 串 的 运算 符 。 上 一 
小 节 我 们 说 字符 串 属 于 序列 类 型 数据 ,其 实 针 对 序列 类 型 数据 的 操作 是 通用 的 ,也 就 是 字 
符 串 和 列表 、 元 组 的 运算 符 是 通用 的 ,通过 这 些 运 算 符 ,可 以 实现 更 丰富 的 序列 操作 效果 。 


3.31 拼接 和 重复 


首先 要 讲 的 是 两 个 数学 运算 符 “ 十 "和 “x ”。 

“十 ”作为 连接 符 的 作用 我 们 在 前 面 见 过 , 它 的 作用 就 是 将 两 个 字符 串 拼 接 在 一 起 。 

“x ?是 重复 符 , 可 以 将 原 字符 串 重复 指定 整数 次 返回 ,需要 注意 的 是 ,返回 的 是 新 字符 
串 , 原 字符 串 不 变 , 用 法 如 下 。 


>>>name = "milo" 
>>>hp = "100" 


>>>hero = name +''+hp 
>>>hero 

"milo 100" 

>>>hp + 3 # 不 可 类 型 混用 


Traceback (most recent call last) : 
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File "<pyshell#16>", line 1, in <module> 

hp+3 

TypeError: must be str, not int 

>>>3 * hp 

"100100100"' 

>>>hp * 3 

"100100100"' 

bp 3 

"100 100 100°' 

>>>hp 

"100' 


上 面 的 例子 中 可 以 看 到 “十 ”和 “x* ”的 使 用 方法 以 及 效果 ,需要 注意 的 是 “十 ”两 边 的 数 
据 类 型 要 一 致 ,不 要 混合 使 用 。 


3.32 比较 运算 符 


比较 运算 符 也 可 以 用 于 字符 串 中 ,当然 ,意义 与 数字 中 的 比较 运算 符 完 全 不 同 。 同 样 ， 
用 于 字符 串 的 比较 运算 符 也 适用 于 其 他 序列 类 型 数据 。 
比较 两 个 字符 串 是 否 相同 ,使 用 "一 一 "运算 符 : 


>>> 'hello' == 'hello' 
True 

>>> 'hello' == 'Hello' 
False 


比较 两 个 字符 串 大 小 ,用 “二 ”和 “一 ”运算 符 , 但 是 ,比较 两 个 字符 串 的 大 小 ,情况 比较 
复杂 ,主要 分 成 两 种 情况 : 单字 符 比 较 和 多 字符 比较 。 


1. 单字 符 比 较 


单字 符 比 较 的 实质 是 两 个 字符 ASCII 码 的 比较 。 因 为 计算 机 存储 数据 时 都 是 数字 形 
式 ,而 ASCII 码 的 作用 就 是 将 字符 映射 到 一 个 整数 。 可 以 通过 ord() 和 chr() 两 个 函数 来 了 
解 ASCII 编码 与 字符 之 间 的 关系 。 


>>>ord('a') 
97 
>>>ord('z') 
2 
>>>ord('A') 
65 
>>>ord('2') 
90 
>>>ord('+') 
43 

>>>chr (99) 
‘ec! 


A 
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所 以 ,比较 两 个 单个 字符 时 ,就 是 比较 通过 ASCII 编码 的 数字 ,你 会 看 到 A 并 没有 比 
a 大 。 


人 

False 

SN 

True 

Er 

True 

>>>'+' < 60 

Traceback (most recent call last): 

File "<pyshell#28>", line 1, in <module> 

+ 60 


TypeError: '<' not supported between instances of 'str' and 'int' 
虽然 ASCII 码 是 把 字符 编码 成 数字 ,但 不 能 直接 用 数字 进行 比较 。 


2. 多 字符 比较 


多 字符 比较 复杂 些 ,但 原理 仍 是 基于 ASCII 码 。 比 较 的 过 程 是 并 行 检查 两 个 字符 串 同 
一 索引 位 置 的 字符 。 从 索引 为 0 的 字符 开始 ,然后 由 左 向 右 , 直 到 找到 不 同 的 字符 为 止 。 如 
果 短 字符 串 一 直到 结束 为 止 都 跟 长 字符 串 一 样 , 则 长 字符 串 大 。 


>>> "abc' < 'abd' 
TYUe 
>>> "abc' < "zbc" 
True 
>>> 'abc' < 'abcd' 
True 


3.3.3 ”成员 判 断 


in 和 not in: 用 于 判断 字符 串 的 成 员 , 判 断 运 算 符 右 侧 字符 串 是 否 包含 左 侧 字符 串 , 用 
法 如 下 。 


>>> "hero' in 'hero 100" 
True 
>>>'x' not in "hero 100"' 
True 
>>>100 in 'hero 100' ”# 抛 异常 的 原因 ? 
Traceback (most recent call last): 
File "<pyshell#41>", line 1, in <module> 
100 in "hero 100" 


TypeError: 'in <string>"' requires string as left operand, not int 
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灵活 多 变 的 字符 串 操作 


对 字符 串 进行 更 多 操作 之 前 ,我们 要 先 搞 清楚 一 些 概念 。 
3.41 函数 


函数 是 用 来 解决 特定 问题 的 一 段 小 程序 ,函数 程序 都 会 封装 起 来 ,所 以 用 户 不 用 看 函 
数 的 代码 是 怎么 写 的 ,只 要 知道 函数 怎么 用 就 可 以 了 。 函 数 可 以 处 理 用 户 提供 的 数据 ,做 
处 理 后 给 用 户 提供 返回 值 。 函 数 的 优点 是 减少 重复 的 程序 。 

Python 提供 了 很 多 类 型 的 函数 ,针对 字符 串 的 有 很 多 ,比如 ,可 以 通过 len() 获 取 字符 
串 的 长 度 ， 


>>>1en('hello') 
5 


Python 自 带 的 函数 叫 作 内 建 函 数 ,len() 函数 不 是 某 个 类 型 专用 的 函数 ,相对 来 说 是 通 
用 的 ,针对 性 不 强 ,我们 也 可 以 用 来 获取 其 他 类 型 序列 的 长 度 ,比如 列表 的 元 组 。 其 他 相关 
的 内 建 函 数 还 有 max() .min() .sum() 和 reversed() 等 ,你 可 以 试 一 下 就 知道 用 法 了 。 

另外 ,我 们 也 可 以 通过 内 建 函 数 str() 将 其 他 类 型 的 数据 转化 为 字符 串 , 用 法 如 下 。 


>>>numInt = 12345 
>>>numFloat = 3.1415926 
>>>numList = [1,2,3,4,5] 
>>>str (numInt) 

"12345 

>>> Str (numFloat) 
'3.1415926' 

>>> str (numList) 

ee Pi 


上 述 转 化 很 生硬 ,比如 最 后 列表 转化 成 了 含有 “ [”“,” 和 “]” 的 字符 串 , 如 果 要 变 成 其 他 
形式 的 字符 串 ,就 需要 专门 的 方法 了 ,将 在 3.5 节 和 3. 6 节 中 进行 讲解 。 


3.42 对象 和 方法 


每 个 类 都 有 对 应 的 对 象 , 比 如 数据 类 型 ,整数 、 浮 点 数 、 字 符 串 都 是 
值 的 类 型 ,都 是 抽象 的 定义 ,简称 为 类 。100、3. 14、'hero' 这 些 值 我 们 可 
以 称 之 为 整数 对 象 . 浮 点 对 象 . 字 符 串 对 象 ,这 些 对 象 是 具备 了 其 对 应 
类 的 全 部 特征 的 一 个 实例 。 
类 在 定义 时 ,会 定义 一 些 功 能 ,方式 跟 函 数 一 样 ,这 些 功 能 可 以 被 
类 实例 化 出 来 的 对 象 所 调用 , 称 为 方法 。 所 以 ,方法 的 实质 就 是 函数 的 
另 一 种 形态 ,区 别 在 于 ,方法 只 能 被 这 个 类 的 对 象 所 调用 ,对 象 通过 点 标记 调用 方法 ,比如 
让 字符 串 hello world 首 字母 大 写 ,代码 如 下 。 
a) 
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>>> "hello world'.capitalize() 
"Hello wor1ld' 


这 里 用 到 的 就 是 字符 串 的 capitalize() 方 法 。 每 个 对 象 的 所 有 方法 可 以 通过 dir() 和 
help() 看 到 ,如 下 所 示 。 





>>>dir (str) 

add ?7 Clas Mr Somtainse a ro delattre er ere doc "rs 
' eq ',"' format ';,'" ge ','" getattribute '__getitem 
'__getnewargs _',"' ly 





J | 


Ee 
"repr _', 

SR __subclasshook _ 
'count', 'encode', 'endswith', 'expandtabs', 'find', 'format', 'format map', 
'index', 'isalnum', 'isalpha', 'isdecimal', 'isdigit', 'isidentifier', 'islower', 
'isnumeric', 'isprintable', 'isspace', 'istitle', 'isupper', 'join', 'ljust', 
'lower', 'lstrip', 'maketrans', 'partition', 'replace', 'rfind', 'rindex', 'rjust', 
"rpartition", "rspiit"y "retrip'", "split"y “splitiines"r "startswith"; "strip'"y 
'swapcase', 'title', 'translate', 'upper', 'zfill'] 








方法 很 多 ,不 用 刻意 去 背 ,随时 可 以 查找 ,比如 在 IDLE 中 输入 对 象 和 点 后 ,只 要 按 Tab 
键 就 可 以 看 到 提示 效果 了 ( 见 图 3-3), 这 时 列 出 的 是 所 有 方法 按 字母 排序 ,用 上 下 箭头 进行 
选择 即 可 。 也 可 以 多 输入 几 个 字母 ,比如 cap, 这 样 就 可 以 过 滤 掉 无 关 的 方法 ,只 显示 


capitalize。 





展 *python 3.6.2 Shel* 本 口 X 
Py 


File Edit Shell Debug Options Window Help 

Python 3.6.2 (v3.6.2:5fd33b5, Jul 8 2817, 84:14:34) [MSC v.1980 32 bit ( 
Intel)] on win32 

Type "copyright", "credits" or "license()" for more information。 

>>> "hello' ,| 








tn:3 Col:12 











图 3-3 Tab 补 全 方法 1 


如 果 想 更 快 找 到 要 用 的 方法 ,可 以 在 点 后 输入 前 几 个 字母 ,比如 要 用 find() 方 法 ,就 可 
以 输入 再 按 Tab 键 ,如 图 3-4 所 示 。 
其 中 的 findO 〇 方法 ,作用 是 查找 指定 字符 串 中 是 否 含有 给 定 的 子 串 : 


>>>hero = "player01 100" 
>>>hero.find('player01') 
0 

>>>hero.find('100') 


心 
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芍 *python 3.6.2 Shell* 一 口 私 


File_ Edit Shell Debug Options Window Help 
Python 3.6.2 (v3.6.2:5fd33b5, Jul 8 2017, 04:14:34) [MSC v.1999 32 bit ( ~ 
Intel)] on win32 

Type "copyright", "credits" or "license()" for more information. 








Ln:3 Col:13 





图 3-4 Tab 补 全 方法 2 


| 

>>>hero.find('0') 

6 
>>>hero.find('milo') 
~ 


如 果 找 到 了 , 则 返回 值 是 第 一 个 字符 的 索引 ;如 果 没 找到 , 则 返回 一 1; 如 果 有 多 个 重复 
元 素 , 则 返回 第 一 次 出 现 的 索引 。 如 果 想 找到 第 二 个 或 第 三 个 ,怎么 办 呢 ? 

解决 问题 的 思路 : 通常 你 在 学 习 时 并 不 能 立刻 掌握 所 有 的 知识 点 (事实 上 对 于 编程 也 
没有 必要 ) ,所 以 现在 我 们 就 一 起 来 理 顺 一 下 解决 这 个 问题 的 思路 吧 。 首 先 ,既然 在 字符 串 
中 查找 子 串 返回 的 是 索引 ,那么 如 果 在 查找 时 跳 过 不 需要 的 索引 开始 查找 是 不 是 就 行 了 
呢 ? 但 是 当 我 们 并 不 知道 有 没有 这 样 的 方法 的 时 候 , 可 以 从 要 操作 的 对 象 人 手 ,查找 是 否 
有 相关 的 方法 。 比 如 现在 要 查找 字符 串 子 串 , 可 以 先 从 find 人 手 看 看 有 没有 其 他 用 法 , 若 
没有 其 他 用 法 ,再 考虑 有 无 其 他 方法 ,从 方法 列表 中 还 会 发 现 一 个 rindex() 方 法 ,然后 通过 
help() 看 一 下 具体 的 说 明 是 否 可 以 实现 你 的 想法 。 下 面 就 是 这 个 过 程 。 

首先 从 find 入 手 : 


>>>help (str.find) 
Help on method descriptor: 


find(...) 
S.find(subl[, start[, end]]) -> int 


Return the lowest index in S where substring sub is found, 
such that sub is contained within S[start:end]. Optional 


arguments start and end are interpreted as in slice notation. 


Return -1 on failure. 


这 里 的 str 代表 字符 串 这 个 类 型 ,并 不 是 哪 一 个 字符 串 。 通 过 help() 可 以 发 现 , 原 来 
find() 还 有 可 选 参数 ,上 述 代 码 中 的 方 括号 即 表示 可 选 参数 ,这 里 的 可 选 参数 作用 是 指定 查 
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找 的 起 止 索引 范围 ,所 以 ,只 要 跳 过 已 找到 的 第 一 个 元 素 的 索引 ,再 找到 的 就 是 第 二 个 了 。 
这 个 例子 我 们 用 了 方法 的 内 套 ,就 是 方法 里 面 还 有 方法 ,执行 顺序 是 先 执行 方法 内 的 方法 ， 
并 将 返回 值 作为 参数 传递 给 上 层 方法 。 这 并 不 高 深 ,主要 取决 于 方法 所 返回 的 值 : 


>>>hero = "player01 100" 
>>>hero.find('0') 

6 

>>>hero.find('0',7) 

10 

>>>hero.find('0',11) 

11 

>>>hero.find('0',hero.find('0') + 1) 
10 


翻 看 其 他 方法 会 发 现 还 有 一 个 方法 名 字 有 index 的 rindex() 方 法 : 


>>>help (str.rindex) 
Help on method descriptor: 


rindex(...) 
S.rindex (sub[, start[, end]]) ->int 


Return the highest index in S where substring sub is found, 
such that sub is contained within S[start:end]. Optional 
arguments start and end are interpreted as in slice notation. 


Raises ValueError when the substring is not found. 


通过 help() 发 现 原来 跟 find() 查 找 方向 相反 是 从 右 向 左 查找 : 


>>>hero = "player01 100" 
>>>hero.rindex('0') 
二 


除了 刚才 用 到 的 嵌 套 ,还 可 以 把 方法 和 函数 通过 点 标记 连接 起 来 使 用 ,例如 : 


>>>hero = "Player01 100" 
>>>hero.find('A') 

二 二 

>>>hero.upper () 

"PLAYERO01 100" 
>>>hero.upper () .find('A') 
局 


3.4.3 分割 和 拼接 


有 时 候 需 要 从 字符 串 或 文件 中 提取 一 些 有 规律 的 数据 ,比如 ,有 一 个 记录 了 很 多 人 信 
息 的 文件 ,每 一 行 存 放 了 一 个 人 的 几 项 记录 。 以 一 行为 例 ,这 些 记录 都 通过 空格 分 隔 ,然后 
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我 们 要 从 中 提取 一 些 信息 ,比如 这 个 人 的 名 字 , 用 法 如 下 。 


>>>milo = "milo 18 180 140" 

>>>zou = "zouqixian 38 185 160" 

>>>milo.split () 

[midior7 “10 “1680 "4140"] 

>>>zou.split() “ # 默 认 以 空格 为 分 隔 符 ,返回 值 为 一 个 列表 
['zouqixian', '38', '185°", '160°'] 

>>>milo.split () [0] 

'milo' 

>>>zou.split () [0] 

'zouqixian' 


原本 长 短 不 一 的 字符 串 ,经 过 分 割 变 成 了 四 个 整体 ,这 样 就 好 操作 了 。 再 比如 提取 计 
算 机 的 IP 地 址 中 最 后 一 段 的 主机 地 址 ,用 法 如 下 。 


Sp 二 IEL92 4656534239 
>>>ip.split('.') 间 自 定义 分 隔 符 
| 作 直下 十 交 下 证 生生 2 
>>>ip.split('.') [-1] 

23 


现在 我 们 可 以 把 字符 串 分 割 成 列表 , 反 过 来 也 可 以 把 列表 拼接 成 字符 串 ,方法 是 以 指 
定 的 字符 串 把 列表 的 各 个 元 素 连 接 起 来 ,用 法 如 下 。 


>>>4p= ["192", 1168" 7 1117 "123*] 

>>>print (ip) 

L920 GO 

>>>".".join(ip) # 以 字符 串 "." 调 用 join 方法 拼接 列表 中 的 对 象 
v192.168,1,.123" 

>>>print (".".join (ip)) 

192.168.1.123 

>>>print ("".join (ip)) # 用 空 字符 串 拼接 
1921681123 

>>>print ("aaa".join(ip)) # 可 自 定义 任意 字符 串 
192aaal68aaalaaal23 


3.4.4 字符 串 模 块 


除了 内 置 函 数 方法 之 外 ,Python 还 提供 了 一 个 string 模块 ,用 来 提供 更 多 的 功能 ,我 
们 先 来 看 一 下 。 


>>>import String 
>>>help (string) 


DATA 


_all =['ascii letters', 'ascii lowercase', 'ascii uppercase', 'cap... 


ascii letters = 'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQORSTUVWXYZ" 


A 
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ascii lowercase = "abcdefghijklmnopqrstuvwxyz 

ascii uppercase = 'ABCDEFGHIJKLMNOPQRSTUVWXYZ" 

digits = '0123456789' 

hexdigits = '0123456789abcdefABCDEF' 

octdigits = '01234567"' 

printable 
'0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTU... 
punctuation = "'!1"#$$%E€\"()*+,-./:;<=>?@[\N\~ {I}~"' 
whitespace = ' \t\n\r\x0b\x0c' 


可 以 在 其 中 看 到 一 些 属 性 是 一 些 特 殊 的 字符 串 , 比 如 所 有 的 小 写 英文 字母 .0 一 9 的 整 
数 、 所 有 符号 等 。 它 们 的 用 法 也 很 多 ,比如 要 写 一 个 程序 ,需要 验证 用 户 输入 的 是 一 个 整数 
还 是 字母 数字 的 组 合 、 去 掉 字 符 串 中 的 所 有 标点 符号 等 。 同 时 里 面 也 提供 了 一 些 方法 ,用 
help() 就 可 以 看 到 。 


> 芋 世 字符 串 格式 化 


我 们 通过 print() 打 印 数 据 , 但 是 print() 的 功能 比较 单一 ,没有 太 多 对 于 格式 的 控制 ， 
字符 串 的 格式 化 则 提供 了 更 多 控制 格式 的 方式 ,使 打印 的 效果 更 漂亮 .工整 。 字 符 串 格式 
化 分 格式 化 操作 符 (%) 和 内 建 函 数 str. format() 两 种 形式 。 


1. 格式 化 操作 符 (% ) 
% 是 Python 风格 的 字符 串 格式 化 操作 符 ,语法 形式 为 


"Format %s string %d ..."% (datal,data2, ...) 


格式 化 字符 串 在 打印 时 与 普通 字符 串 一 样 ,区 别 在 于 字符 串 中 %s 和 %d 这 样 的 描述 符 
位 置 会 被 % 右 侧 括号 内 的 一 组 数据 所 替换 ,而 且 数 据 和 描述 符 的 类 型 及 数量 都 是 对 应 的 ， 
例如 : 


>>>msg = "hello %s ,your hp is: $d" 
>>>print (msg) 

hello ss ,your hp is: $d 

>>>print (msg %$ ('milo',100)) 

hello milo ,your hp is: 100 


这 个 例子 中 的 %s 是 字符 串 描述 符 ,表示 需要 用 字符 串 来 替换 ;%d 代表 的 是 十 进 制 整 
数 , 则 需要 用 整数 来 蔡 换 。 除 了 这 两 个 之 外 ,还 有 很 多 描述 符 以 及 可 选项 ,其 他 可 选项 和 党 
用 的 描述 符 如 下 : 


SS[(name)] [flags] [width].[precision]typecode # 方 括号 中 为 可 选 参 数 





其 中 , (name) 可 选 , 用 于 选择 指定 的 key; 
可 选 ,可 供 选 择 的 值 有 : 十 表示 右 对 齐 , 正 数 前 加 正 号 ,负数 前 加 负 号 ;一 表示 





flags 
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左 对 齐 , 正 数 前 无 符号 ,负数 前 加 负 号 ;空格 表示 右 对 齐 , 正 数 前 加 空格 ,负数 前 加 负 号 ;0 表 
示 右 对 齐 , 正 数 前 无 符号 ,负数 前 加 负 号 ;用 0 填充 空白 处 。 











width 一 一 可 选 ,占有 宽度 ; 
. precision 一 一 可 选 ,小数点 后 保留 的 位 数 ; 
typecode 必 选 ; 


s 表示 获取 传人 对 象 的 __str__ 方 法 的 返回 值 ,并 将 其 格式 化 到 指定 位 置 ; 

r 表示 获取 传人 对 象 的 __repr_ 方法 的 返回 值 ,并 将 其 格式 化 到 指定 位 置 ; 

d 表示 将 整数 、 浮 点 数 转换 成 十 进 制 表 示 ,并 将 其 格式 化 到 指定 位 置 ; 

f 表示 将 整数 、 浮 点 数 转换 成 浮 点 数 表示 ,并 将 其 格式 化 到 指定 位 置 ( 默 认 保 留 小 数 点 
后 6 位 ); 

%, 当 字符 串 中 存在 格式 化 标志 时 ,需要 用 %% 表 示 一 个 百 分 号 。 

通过 宽度 描述 符 width 可 以 让 数据 变 工整 ,就 好 像 有 个 表格 一 样 ,用 法 如 下 。 


#strformat .py 

hero = "name:%$-10s hp:%6d" # 字 符 串 宽度 为 10 左 对 齐 ,数字 宽度 为 6 
milo= ('milo', 100) 

zou= ('zou', 6) 

Qi = (i 9) 


print (hero $milo) 


print (hero %$zou) 
print (hero $qi) 


运行 效果 如 图 3-5 所 示 。 

















芍 Python 3.6.2 shell 一 口 X 

File Edit Shell Debug Options Window Help 

name: mlo hp: 169 ~ 

nam zou hp 6 

name qi hp 99 

b>> ~ 
Ln:281 Col:0 

图 3-5 运行 效果 


. precision 是 浮 点 数 精度 描述 符 , 可 以 指定 保留 小 数 点 后 几 位 : 


>>>import math 

>>>math.pi 

3.141592653589793 

>>>print ('pi =%.2f' $math.pi) 


pi=3.14 
>>>print ('pi =$10.2f' smath.pi) #10 是 宽度 描述 符 (.2) 是 精度 描述 符 
Pi = Sa 


2. 内 建 函 数 str.format 


在 Python 中 ,字符 串 对 象 还 有 个 方法 format, 也 是 用 来 实现 格式 化 字符 串 的 。 为 了 培 
养 好 习惯 ,建议 一 定 要 在 手册 中 找到 str. format() ,自学 掌握 ,并 且 尝 试 自己 学 习 消化 。 最 
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好 不 要 用 搜索 引擎 找 别 人 实验 的 例子 , 那 都 是 二 手 知识 ,相信 自己 ,可 能 开始 有 点 费劲 ,但 
学 会 查 手册 对 于 学 习 任 何 有 文档 的 技术 都 是 必 备 的 。 


> 于 汉人 遍 历 字符 串 


遍历 可 以 理解 为 每 个 都 访问 一 次 的 意思 ,如 果 想 对 字符 串 字 符 做 逐个 操作 ,就 需要 遍 
历 。 遍历 操作 需要 for 循环 做 迭代 访问 ,最 基本 的 方法 为 


>>>for i in "hello": # 并 是 迭代 变量 ,每 次 从 字符 串 取 一 个 字符 
print (i) 


DOPPhPoe pp 


如 果 需 要 索引 ,可 以 借助 一 个 函数 enumerate( ) : 


>>>for i in enumerate ("hello"): 
print (i) 


(0, 'h') 
(Lr ey 
(2, "1') 
(Sr 1 
{de eon) 


enumerate() 返 回 的 是 元 组 数据 ,每 次 返回 一 对 索引 和 值 ,也 可 以 直接 把 它们 分 开 : 


>>>for i,v in enumerate ("hello"): 
print (i,"-->",v) 


0=->h 
es 
入 > 主 
3 
人 


关于 遍历 的 应 用 ,在 流程 控制 中 还 会 在 讲 到 。 不 过 有 了 遍历 ,我 们 就 可 以 对 字符 串 做 
更 多 设计 了 ,在 作业 中 布置 了 一 个 小 任务 ,去 完成 吧 。 


| 里 重点 提示 


在 这 一 章 中 ,你 要 掌握 的 内 容 : 
(1) 熟悉 各 种 字符 串 定义 的 方法 。 
(2) 理解 序列 的 概念 。 
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(3) 熟练 字符 串 切片 .拼接 、 成 员 判 断 、 遍 历 等 操作 。 
(4) 了 解 字符 串 操作 的 函数 和 方法 。 
(5) 熟悉 字符 串 的 格式 化 操作 。 


民 动 动手 


(1) 将 姓名 的 中 文 表示 换 成 英文 表示 ,名 在 前 , 姓 在 后 。 

(2) 用 户 输入 用 “,” 间 隔 的 数字 ,如 “1,3,5,23,45”, 求 出 数字 之 和 。 

(3) 由 用 户 随 意 输 入 一 串 字 符 , 通 过 程序 筛选 出 这 一 串 字 符 串 是 否 含有 py\t\h、on 
六 个 字符 。 若 有 ， 拼 接 起 来 组 成 friend 打印 到 屏幕 上 ;统计 出 这 一 上 串 字符 可 以 组 成 几 个 
friend。 

(4) 设计 一 个 简明 的 纯 文字 流程 式 游戏 (英雄 无 敌 》, 随 着 学 习 的 深入 ,会 逐渐 完善 这 个 
小 游戏 ,你 也 可 以 根据 自己 的 想法 进行 设计 ,大 致 流程 如 下 。 

Q@ 游戏 启动 后 显示 欢迎 界面 。 

@ 玩家 开始 游戏 前 可 以 先 给 英雄 起 名 字 。 

@ 游戏 开始 时 先 初始 化 英雄 信息 ,如 名 字 、 血 、 攻 击 力 等 并 显示 到 屏幕 上 。 

@ 通过 适合 的 方式 存储 人 物 名 字 、 人 物 的 血 等 。 

@ 有 个 直线 十 格 地 图 ,英雄 可 在 地 图 上 一 步 一 步 前 进 (后 期 需要 判断 和 循环 ), 暂 时 可 
以 通过 10 个 input() 达 到 让 用 户 输入 10 次 数据 的 形式 ,从 感觉 上 好 像 走 了 10 步 。 

@ 在 每 一 格 上 会 有 随机 事件 发 生 , 如 踩 地 雷 掉 血 、 吃 包子 加 血 等 (后 期 需要 函数 封装 ) 。 

@ 随机 事件 用 random 模块 或 暂时 可 不 用 随机 数 ,不 同 格 发 生 固定 事件 即 可 。 


A 





流程 控制 


编程 的 目的 是 解决 问题 ,现在 我 们 已 经 可 以 让 计算 机 按 顺 序 执行 (从 上 至 下 依次 执行 ) 
指令 了 。 但 实际 处 理 问 题 时 ,有 些 程序 需要 进行 选择 性 执行 ,有 些 程序 还 需要 反复 执行 多 
次 。 如 果 前 面 写 的 程序 都 是 流水 账 ,那么 接 下 来 我 们 掌握 流程 控制 就 可 以 随意 控制 程序 的 
走向 , 写 出 千变万化 的 程序 了 。 

没有 流程 控制 的 (英雄 无 敌 ) 最 多 只 是 个 按 顺序 执行 的 故事 。 有 了 流程 控制 ,这 个 游戏 
就 可 以 更 加 丰富 灵活 了 ,可 以 让 玩家 选择 行进 的 方向 ,也 可 以 让 游戏 一 直 运 行 到 Game 
Over 或 者 用 户 决 定 退出 时 才 结 束 。 

比如 下 面 这 样 的 运行 过 程 (“# ”表示 地 图 ,“ x ”代表 英雄 所 在 位 置 ) 。 


- *-Wwelcome to Heroes world!- *- 
input your name:milo 
HI! milo You Hp is : 100 


- #*-the world is like this - 关 一 
覃 提 划 并 间 间 并 
-*-the'*"'isyou 一 关 一 


contrl your hero:| 'a'for left | 'd' for right | 
YOU are here x ###### 
go or quit:d 

you are h,ere # 关 ##### 
go or quit:d 

you are here ## x #### 
go or quit:d 

you are here ###  ### 
go or quit:d 

you are here ####  ## 
go or quit:a 

you are here ### x ### 
go or quit:a 

you are here ## x #### 
go or quit:a 

you are here # x ##### 
go or quit:quit 
goodbey!! 
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让 程序 变 智 能 的 分 支 结构 : if 语句 


分 支 结 构 的 语法 并 不 复杂 ,经 过 精确 的 设计 和 组 合 ,可 以 解决 很 多 
看 似 复杂 的 问题 ,比如 人 工 智能 领域 的 决策 树 算法 就 是 由 许多 分 支 结 
构 构 成 的 ,你 可 以 让 计算 机 用 决策 树 算法 分 辨 出 一 个 物体 是 椅子 还 
是 狗 。 hy 
让 语句 是 最 基本 的 条 件 测试 语句 ,通过 条 件 表达 式 的 结果 选择 执 ee 
行 指定 的 语句 。 判 断 对 和 错 是 计算 机 最 擅长 的 事 ,因为 理论 上 计算 机 
只 认识 0 和 1, 而 作为 选择 的 判断 依据 就 可 以 用 0( 假 ) 和 1( 真 ) 来 表示 。 比 如 ,英雄 在 地 图 
上 是 否 移动 就 是 二 选 一 ,当然 你 可 能 需要 上 、 下 , 左 、 右 这 种 复杂 移动 的 选择 , 即 多 个 选择 ， 
这 就 需要 将 简单 的 选择 进行 组 合 或 者 使 用 字典 (一 种 数据 结构 ) 来 实现 。 

图 4-1 的 意思 就 是 ,当主 程序 执行 到 计 语 句 时 就 好 像 到 了 一 个 分 岔路 口 ,要 根据 一 个 条 
件 表 达 式 的 结果 作出 判断 。 如 果 这 个 表达 式 的 返回 值 是 True, 则 选择 其 中 一 条 分 支 ;如 果 
是 False, 则 选择 另 一 条 ,可 以 设置 多 个 elif 来 增加 条 件 , 当 通过 判断 后 的 语句 块 执行 完毕 
后 , 则 回 到 主 程序 的 其 他 语句 继续 执行 。 











进入 i 判断 语句 















True 语 句 块 












































1 
True 语 句 块 else 语 句 
1 
else 语 句 块 
4-1 if 流程 图 


411 if 语 法 结构 
让 的 语法 形式 比较 灵活 ,可 以 根据 实际 问题 灵活 运用 ,主要 有 以 下 四 种 形式 。 
1 条 件 执行 
最 简单 的 条 件 执行 ,语法 结构 为 


if 条 件 表达 式 : 
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语句 体 


过 根据 条 件 表达 式 返 回 的 布尔 值 决定 是 否 执行 之 后 的 语句 体 。 布 尔 值 为 真 , 则 执行 语 
旬 体 ;为 假 , 则 什么 都 不 做 。 为 区 别 语句 体 与 主 程序 ,if 之 后 的 语句 体 需 要 缩 进 4 个 空格 ,这 
种 类 型 的 语句 成 为 复合 语句 。 在 Python 中 需要 缩 进 的 地 方 默认 都 是 四 个 空格 ,当然 ,你 也 
可 以 使 用 Tab 键 ,但 是 最 好 设置 Tab 的 缩 进 量 为 四 个 空格 ,而 且 千 万 不 要 空格 和 Tab 混合 
使 用 ,会 造成 很 多 麻烦 。 

语句 体 中 的 代码 数量 没有 要 求 ,有 多 行 语句 时 需要 保持 一 致 的 缩 进 量 , 但 最 少 要 有 一 
行 。 如 果 在 设计 代码 遇 到 一 个 语句 体 什 么 都 不 做 (通常 标记 一 个 我 们 还 没 来 得 及 写 功 能 代 
码 的 时 候 ) ,这 时 用 pass 语句 ,pass 语句 的 作用 就 是 什么 都 不 做 ,被 称 为 代码 桩 ,只 起 到 占 位 
的 作用 。 


if age > 18: 
pass 


2. 选择 执行 


第 二 种 形式 是 选择 执行 ,这 种 情况 就 会 产生 分 支 效 果 , 仍 然 由 条 件 表达 式 返 回 的 布尔 
值 决 定 被 执行 的 语句 体 ,语法 结构 为 
if 条 件 表达 式 : 
语句 体 
else: 
语句 体 
这 里 多 了 一 个 else, 当 站 的 条 件 表达 式 为 False 时 ,就 会 执行 else 的 语句 体 。 比 如 用 程 
序 处 理 一 个 申请 ,申请 人 需要 输入 自己 的 年 龄 , 满 18 岁 才 可 以 通过 ,代码 如 下 : 


age = int (input ("please input you age:")) 
if age >= 18: 

print ("Enter") <# 此 处 行 首 有 4 个 空格 
else: 

print ("Sorry! Too young!") 


条 件 表达 式 20 之 =18 ,返回 值 为 True, 所 以 屏幕 上 会 打印 Enter。 
3. 条 件 链 


有 时 需要 判断 的 条 件 不 止 一 个 ,需要 更 多 分 支 。 这 时 的 语法 形式 叫 条 件 链 或 者 多 
分 支 : 


if 条 件 表达 式 : 
语句 体 

elif 条 件 表达 式 : 
语句 体 


else: 


语句 体 
ee ) 
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比如 我 们 要 做 计算 器 ,就 需要 判断 用 户 输入 的 运算 符 , 代 码 如 下 : 


operator = input () 

= 

y=2 

if operator == "+"': 
print (1 + 2) 

elif operator == '—": 
print (1 - 2) 

elif operator == '*': 
print(1 * 2) 

elif operator == '/': 
print(1/ 2) 

else: 
print ("opertor:+—- * /") 


这 里 的 elif( 其 实 就 是 else if) 意 思 是 当 上 一 个 条 件 表 达 式 返回 值 为 False 时 ,就 会 判断 
新 的 条 件 ,使 用 的 数量 没有 限制 。 所 有 的 条 件 顺序 执行 ,哪个 条 件 为 真 , 则 执行 哪个 语句 
体 , 如 果 所 有 条 件 都 为 真 , 则 只 执行 第 一 个 。 如 果 有 else 语句 ,只 能 放 在 最 后 。 


4 . 谋 套 


条 件 判 断 语句 体 内 可 以 再 嵌 套 条 件 语句 ,以 后 我 们 再 学 其 他 语法 ,都 可 以 灵活 嵌 套 , 目 
的 是 解决 问题 。 
比如 ,做 一 个 三 分 法 ,判断 两 个 数字 x 和 y 的 大 小 ,代码 如 下 : 


if x ==y: 
print('x and y are equal') 
else: 
和 
Print('x is less then y') 
else: 
Print('x is greater than y') 


这 个 程序 中 的 第 一 个 计 产 生 两 个 分 支 ,其 中 第 二 个 分 支 中 又 产生 一 个 分 支 ,区 别 的 方 
式 就 是 嵌 套 在 内 部 的 寺 相 对 于 第 一 层 整 体 进行 了 缩 进 。 不 过 , 髋 套 语句 层 数 不 宜 超过 
3 层 , 嵌 套 层 数 太 多 会 让 代码 阅读 起 来 非常 困难 ,应 该 尽量 避免。 


412 布尔 值 与 if 


通过 上 面 的 例子 可 以 看 到 分 支流 程 二 选 一 的 过 程 ,而 其 中 的 关键 因素 就 是 给 定 的 条 件 
表达 式 , 想 让 程序 “乖乖 听话 ”, 这 个 表达 式 要 准确 地 反映 出 做 判断 的 依据 。 

在 条 件 表达 式 中 需要 理解 的 就 是 返回 的 布尔 值 ,布尔 值 只 有 两 个 值 : 真 和 假 。 值 得 一 
提 的 是 ,虽然 只 有 真 和 假 ,但 表现 形式 不 仅仅 是 True 和 False 或 者 1 和 0。 

布尔 表达 式 会 被 解释 器 看 作 False 的 值 有 : 

(1) None。 

(2) False。 


A 
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(3) 任何 为 0 的 数字 类 型 ,如 0、0. 0、0j。 

(4) 任何 空 序列 ,如 "、O、[]。 

(5) 任何 空 字典 ,如 {}。 

(6) 用 户 定 义 的 类 实例 ,如 果 类 定义 了 _ _bool__O 〇 或 者 ._len __() 方 法 ,并 且 该 方法 返 
回 0 或 者 布尔 值 False。 

其 他 所 有 值 被 解释 器 看 作 True。 

可 以 用 bool 将 其 他 值 转换 为 布尔 值 ,在 这 里 看 一 下 效果 ,实际 编程 时 不 需要 。 


>>>boo1('') 

False 

>>>bool('this is a test') 
True 

>>>bool (42) 

True 

>>>boo1 (0) 

False 


413 逻辑 运算 符 与 if 


有 了 布尔 值 ,我们 可 以 完成 大 多 数 的 判断 ,但 是 碰 到 这 样 的 问题 呢 ? 比如 报考 C1、C2 
驾驶 证 的 条 件 是 满 18 岁 小 于 70 岁 , 这 里 有 两 个 条 件 要 同时 满足 才 可 以 ,这 种 情况 我 们 有 两 
种 选择 : 一 种 是 让 语句 嵌 套 实现 ,但 是 嵌 套 对 于 程序 阅读 来 说 不 是 很 友好 ; 另 一 种 是 利用 迎 
辑 运 算 符 ,第 2 章 中 我 们 简单 介绍 过 逻辑 运算 符 一 共有 三 个 and .or 和 not。 


1. 逻辑 与 
逻辑 与 运算 符 and 的 作用 是 ,只 有 左右 皆 为 真 时 结果 才 为 真 ,例如 : 


>>>True and True 
True 

>>>True and False 
False 

>>>False and False 
False 


前 面 提 到 报考 驾驶 证 验证 的 例子 可 以 写成 这 样 : 


age = int (input ("please input you age:")) 
if age >= 18 and age < 70: 

print ("Enter") 
else: 

print ("Sorry!") 


2. 逻辑 或 
逻辑 或 的 作用 是 ,运算 符 or 左右 有 一 个 为 真 , 则 结果 为 真 , 跟 逻 辑 与 的 区 别 在 于 : 


fo 
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>>>True or False 
True 


比如 判断 一 个 数 是 否 为 3 或 5 的 倍数 ,符合 条 件 的 如 3.5.6、.9、15 ,条件 语句 如 下 : 


Xx%3== 0 or x%5==0 


3. 逻辑 非 
人 逻辑 非 的 作用 就 是 给 布尔 值 作 否 定 , 例 如 : 


>>>not True 
False 
>>>not False 
True 


比如 判断 一 个 字符 串 不 为 空 : 


user input = input ("Your name:") 
if not user input: 
print ("your name is: ",user input) 


需要 说 明 一 点 ,and 和 or 运算 有 一 条 重要 法 则 : 短路 计算 。 

(1) 在 计算 a andb 时 ,如 果 a 是 False, 则 根据 与 运算 法 则 ,整个 结果 必定 为 False, 因 
此 返回 a; 如 果 a 是 True, 则 整个 计算 结果 必定 取决 于 b, 因 此 返回 b。 

(2) 在 计算 a or b 时 ,如 果 a 是 True, 则 根据 或 运算 法 则 ,整个 计算 结果 必定 为 True， 
因此 返回 a; 如 果 a 是 False, 则 整个 计算 结果 必定 取决 于 b, 因 此 返回 b。 

所 以 Python 解释 器 在 做 布尔 运算 时 ,只 要 能 确定 计算 结果 ,就 不 会 继续 往 后 计算 , 直 
接 返回 结果 。 


> 县. 入 用 条 件 循 环 : while 语句 


计算 机 可 以 在 短 时 间 内 处 理 大 量 重复 的 语句 , 随 着 硬件 技术 水 平 
的 提升 ,计算 机 能 完成 的 计算 量 越 来 越 大 ,通过 计算 机 来 处 理 大 量 简单 
重复 的 指令 可 以 完成 很 繁重 的 任务 ,这 也 是 程序 存在 的 意义 。 

在 编程 领域 里 我 们 称 重复 为 循环 ,从 流程 示意 图 4-2 可 以 看 出 , 执 
行 重复 语句 的 过 程 就 像 个 循环 的 过 程 。Python 中 提供 了 两 种 形式 的 
循环 语句 来 执行 重复 的 指令 ,分别 是 while 和 for。 


421 while 语句 


当 要 执行 的 重复 指令 与 条 件 判断 有 关 时 ,就 要 用 到 while 了 。while 语句 是 条 件 循环 语 
句 ,如 果 条 件 为 True, 就 会 一 直 重 复 执行 循环 体 ; 如 果 条 件 为 False, 则 继续 执行 程序 的 其 他 
部 分 。 一 般 用 来 解决 不 确定 循环 多 少 次 的 循环 ,当然 ,通过 程序 设计 也 可 以 用 while 解决 循 


网 
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环 次 数 确定 的 问题 。 
while 语句 的 基本 语法 为 


while 条 件 表 达 式 : 
循环 体 


while 语句 的 条 件 表达 式 的 值 是 布尔 型 ,循环 体 为 while 的 子 句 , 格 式 上 与 证 类 似 , 需 要 
进行 四 个 空格 的 缩 进 。 

while 语句 的 执行 过 程 如 图 4-2 所 示 。 

(1) 程序 执行 到 while 时 , 先 判断 条 件 表 达 式 的 值 。 

(2) 条 件 表达 式 值 为 真 时 ,执行 循环 体 代码 。 

(3) 循环 体 执行 后 while 控制 语句 回 到 条 件 表达 式 位 置 继续 判断 。 

(4) 如 果 表 达 式 值 为 真 , 则 重复 (2)、(3) 两 个 步骤 ,如 果 条 件 表 达 式 值 为 假 , 则 不 执行 循 
环 体 ,同时 while 循环 结束 ,程序 继续 执行 while 之 后 的 代码 。 











进入 while 循 环 语句 









False 





while 条 件 表达 式 


1 








True 语句 块 产 一 一 











-一 一 | else 语 句 











else 语 句 块 











图 4-2 ”While 流程 图 
我 们 来 看 下 面 的 例子 ,用 户 输入 为 q 或 Q 时 结束 循环 ,否则 一 直 执行 循环 : 


#while01.py 
user input = input ('input something:') 


while user input != 'q' and user input != 'Q': 
print('your input is s%', user input) 
user input = input ('"q" or "Q" for quit:') 


Print('here is not while') 


程序 第 一 行 定义 了 一 个 获取 用 户 输入 的 变量 user_input, while 语句 根据 这 个 变量 值 
是 否 是 q 或 者 Q 执行 while 的 循环 体 ,都 不 是 , 则 条 件 表达 式 值 为 真 , 在 循环 体 中 ,再 次 对 
user_input 进行 复制 ,这 个 值 再 带 回 条 件 表达 式 中 进行 判断 ,直到 条 件 为 假 , while 循环 
结束 。 

运行 效果 如 下 : 


fo 
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>>> 

input something:hello 
Your input is ss hello 
wap or MO Eor qiu 
your input is ss quit 
Sav or "O" For quit:Q 
here is not while 

>>> 


422 While...else 语句 


另外 ,Python 中 还 提供 了 一 种 和 其 他 大 多 数 语言 都 不 同 的 结构 while...else, 基 本 语 
法 为 


while 条 件 表达 式 : 
循环 体 
else: 


语句 


如 果 带 有 else 语句 , 则 while 语句 正常 结束 后 会 执行 else 字句 ;如 果 while 语句 被 
break 破坏 , 则 不 执行 else 字句 。break 是 循环 控制 语句 ,用 来 终止 循环 。 
我 们 改造 一 下 上 面 的 例子 : 


#while else 01.py 
user input = input ('input something:') 


while user input != 'q' and user input != 'Q': 
if user input quit': 
break 
print('your input is s%', user input) 
user input = input ('"q" or "Q" for quit:') 
else: 
Print('end of the loop!') 





Print('here is not while') 
运行 效果 如 下 : 


>>> 
input something:hello 
Your input is ss hello 
Saw or "OQ" For quitsdq 
end of the loop! 

here is not while 

>>> 

input something:hello 
Your input is ss hello 


A 
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Wow Op sO Eor OURE SUSEE 
here is not while 
>>> 


从 结果 可 以 看 到 , 当 通 过 条 件 表 达 式 的 值 让 循环 结束 时 ,else 语句 内 的 代码 会 执行 ,而 
在 循环 内 通过 break 指令 结束 循环 时 , 则 不 执行 else 中 的 代码 。 


42.3 死 循 环 和 break 


设计 循环 的 条 件 表达 式 时 需要 注意 一 点 ,就 是 可 能 会 造成 死 循 环 。 若 条 件 表达 式 结果 
总 是 True, 就 会 一 直 进 行 循环 体 的 执行 。 不 过 ,有 些 时 候 我 们 会 需要 这 种 死 循环 ,比如 要 一 
直 执行 一 段 程序 ,或 者 结束 循环 的 条 件 比较 复杂 ,条 件 表 达 式 设计 不 便 时 。 这 时 的 用 法 通 
常 如 下 : 


while True: 


循环 体 


当然 ,自己 设计 的 死 循环 一 定 要 有 中 断 指令 ,如 input() ,或 者 可 以 结束 的 语句 , 如 
break ,否则 ,哪怕 只 是 循环 输出 hello world, 对 计算 机 来 说 也 是 无 意义 的 资源 浪费 ,不 过 ,在 
交互 模式 下 ,可 通过 Ctrl 十 C 组 合 键 结束 死 循 环 。 上 面 的 例子 就 会 变 成 这 样 : 


#while True 01.py 
print('input something:') 


while True: 
user input = input ('"q" or "Q" for quit:') 
if user input != 'q' and user input != 'Q': 
break 
print('your input is s%', user input) 


print('here is not while') 


这 种 循环 的 形式 很 常见 ,因为 这 样 我 们 就 可 以 把 循环 的 判断 条 件 放 在 循环 体内 任何 地 
方 ,并 且 可 以 表示 当 某 个 条 件 成 立时 结束 循环 ,而 不 是 在 while 顶端 只 能 在 条 件 失 败 时 结束 
循环 。 

break 语句 的 作用 是 在 循环 过 程 中 提前 结束 循环 ,通常 通过 计 语 句 触发 。 有 了 break， 
我 们 就 可 以 灵活 地 结束 循环 ,可 以 用 在 while 和 for 循 环 中 。 但 是 ,本 着 简洁 的 原则 ,如果 只 
要 很 简单 的 条 件 就 可 以 结束 循环 ,就 不 要 画蛇添足 地 设计 break 了 。 


42.4 确定 次 数 的 循环 


有 时 候 我 们 需要 为 循环 执行 指定 次 数 ,为 了 控制 循环 的 次 数 ,通常 需要 在 程序 中 设置 
一 个 计数 变量 ,每 次 循环 时 ,这 个 变量 自 加 或 自 减 , 当 这 个 值 达到 指定 值 时 ,循环 结束 。 

比如 , 想 要 计算 1 十 2 十 3 十 … 十 100 的 值 ,就 可 以 设计 循环 从 1 递增 到 100 或 从 100 递 
减 到 1。 因为 这 个 值 的 范围 是 已 知 的 ,所 以 循环 的 次 数 也 是 确定 的 ,程序 如 下 : 


心 
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#1+2+3+...+100 
Er 3.1. 0 
while i <= 100:; 
s=3+i 
1i+=1 
print ("1+2+3+4+...+100 = ",s) 


运行 结果 如 下 : 


1+2+3+4+...+100 = 5050 
>>> 


这 个 过 程 就 是 我 们 设计 了 一 个 计数 变量 i 和 一 个 累加 变量 s, 通 过 i 的 变化 控制 循环 的 


次 数 ,同时 i 作为 每 次 累加 的 数值 来 源 ,最 后 通过 s 把 每 次 的 i 累加 起 来 。 


需要 说 明 的 是 ,虽然 可 以 这 样 设计 一 个 固定 次 数 的 循环 ,但 通常 会 用 for 来 设计 这 样 的 


程序 。 


掌握 了 while 的 语法 ,就 可 以 结合 让 在 开篇 (英雄 无 敌 》 游 戏 中 ,实现 英雄 在 地 图 上 行走 


的 效果 了 。 具 体 的 设计 由 你 自己 来 考虑 ,不 必 完 全 一 样 。 


(> 丰 容 迭代 循环 : for 语句 


Python 中 提供 的 另 一 个 循环 语句 for, 与 while 根据 条 件 表达 式 的 真 假 确定 是 否 进 行 
循环 不 同 ,for 语句 是 通过 迭代 可 和 迭代 对 象 实现 循环 。for 接受 序列 或 迭代 器 作为 其 参数 ， 
每 次 循环 取出 其 中 一 个 元 素 ,循环 的 次 数 取决 于 序列 或 迭代 器 中 元 素 的 个 数 。 





for 语句 的 基本 语法 为 


for 变量 in 可 迭代 对 象 : 
循环 体 
else: 
语句 
for 语句 的 执行 过 程 如 图 4-3 所 示 。 
(1) 程序 执行 到 for。 
(2) 变量 从 in 后 面 的 可 和 迭代 对 象 中 取 值 , 取 到 值 则 执行 循环 体 。 
(3) 循环 体 每 次 执行 完 后 ,再 重复 步骤 (2) ,由 此 产生 循环 。 
(4) 变量 从 可 和 迭代 对 象 中 获取 不 到 值 时 , 则 不 执行 循环 体 ,循环 结束 。 
(5) else 的 作用 同 while, 也 是 可 选项 。 
Python 中 的 内 置 数据 类 型 列表 ,元 组 ,字符 串 、 字 典 、 集 合 等 都 是 可 迭代 对 象 ,可 以 通过 


for 语句 进行 迭代 ,所 以 我 们 经 常会 使 用 for 来 遍历 这 些 类 型 的 数据 ,比如 遍历 字符 串 : 


>>>for i in "hello world": 
print (i) 


A 
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进入 for 循 环 语句 


和 迭代 对 象 


语句 块 


| 


| else 语 句 


| 


else 语 句 块 











有 可 迭代 值 








无 可 迭代 值 





























图 4-3 for 流程 图 


4.3.1 容器 和 友 代 器 


容器 (container) 是 一 种 把 多 个 元 素 组 织 在 一 起 的 数据 结构 ,容器 中 的 元 素 可 以 被 逐个 
迭代 获取 ,可 以 用 in 和 not in 关键 字 判 断 元 素 是 否 包含 在 容器 中 。 通 常 这 类 数据 结构 把 所 
有 的 元 素 存储 在 内 存 中 (也 有 一 些 特 例 ,并 不 是 所 有 元 素 都 放 在 内 存 , 比 如 迭代 器 和 生成 器 
对 象 ) ,在 Python 中 ,常见 的 容器 对 象 有 list、set、 dict、tuple、str。 

我 们 也 可 以 创建 一 个 容器 ,包含 一 系列 元 素 , 可 以 通过 for 语句 依次 循环 取出 每 一 个 元 
素 , 这 种 容器 叫 和 迭代 器 (iterator) 。 

迭代 器 简单 来 说 就 像 机 器 一 样 生产 数据 ,只 是 数据 是 事先 订 制 好 的 ,容器 大 多 数 时 候 
是 把 数据 放 在 内 存 中 ,而 迭代 器 则 是 当 有 人 去 调用 时 才 会 在 内 存 中 记录 一 个 值 。 实 际 的 调 
用 通过 next 〇 方法 。 和 迭代 器 的 意义 在 于 当 序 列 长 度 很 大 时 ,可 以 减少 内 存 消耗 ,因为 每 次 
只 需要 记录 一 个 值 。 有 些 时 候 只 有 和 迭代 器 是 最 好 的 选择 。 

一 个 简单 的 例子 就 可 以 看 出 区 别 , 比如 想 循环 一 段 程序 一 万 次 ,如 果 用 for 循环 来 实 
现 , 你 会 用 像 刚才 遍历 hello world 的 例子 那样 用 一 个 含有 一 万 个 字符 的 字符 串 来 当 作 可 迭 
代 对 象 吗 ? 显然 不 会 ,这 种 情况 通常 用 range() 函 数 , 在 Python 2.7 中 分 range() 和 xrange()。 
它们 的 区 别 就 在 于 ,range() 会 直接 在 内 存 中 生成 一 个 列表 ,而 xrange() 则 是 一 个 迭代 器 , 当 
元 素 比较 多 时 用 xrange() 更 省 内 存 , 所 以 在 Python 3 中 range() 的 功能 直接 变 成 xrange() ， 
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而 不 再 分 成 两 个 。 





range() 的 作用 可 以 理解 为 可 生成 一 个 序列 的 迭代 器 ,可 指定 起 始 值 终止 值 和 步 长 值 。 


>>>i = range (10) 
>>>type (i) 
<class 'range'> 
>>>print (i) 
range (0, 10) 
>>>for x in i: 
print (x) 


woJaurwhN po 


>>>1ist (i) 
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 


在 这 个 例子 里 ,我们 通过 range() 声 明了 一 个 可 以 产生 0 一 9 十 个 数字 的 迭代 器 ,直接 


打印 是 看 不 见 的 ,但 是 通过 for 就 可 以 迭代 出 每 一 个 值 , 当 然 , 也 可 以 直接 把 它 转化 成 一 个 
列表 ,在 Python 2 中 比较 range() 和 xrange() 可 以 看 得 比较 直观 。 


range() 还 可 以 通过 参数 生成 一 些 特定 的 序列 ,例如 : 


>>>1ist (range (1,10)) 
[1, 2, 3, 4, 5, 6; 7, 8, 9] 
>>>1ist (range (1,10,2)) 
tLe 3 Sr Tr 9 


至 于 迭代 器 本 身 , 实 质 是 实现 了 next() 方 法 的 对 象 ,常见 的 元 组 .列表 、 字 典 都 是 迭代 
迭代 器 中 重点 关注 以 下 两 个 方法 就 可 以 了 (iter 和 next 前 后 都 是 双 下 划 线 ) 。 

__iter 方法 : 返回 迭代 器 自身 。 可 以 通过 Python 内 建 函 数 iter() 调 用 。 

__next 方法 : 当 next 方 法 被 调用 时 ,迭代 器 会 返回 它 的 下 一 个 值 ,如 果 next 方法 被 


调用 ,但 迭代 器 没有 值 可 以 返回 ,就 会 引发 一 个 StopIteration 异常 。 该 方法 可 以 通过 
Python 内 建 函数 next() 调 用 。 


>>>i = iter ("12345") 

>>>type (i) 

<class 'str iterator'> 

>>>print (i) 

<str iterator object at 0x05F886B0> 
>>>next (i) 
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‘1 

>>>next (i) 

412， 

>>>for x ini: 
print (x) 


3 

4 

5 

>>>next (i) 

Traceback (most recent call last): 

File "<pyshell#43>", line 1, in <module> 

next (i) 

StopIteration 


在 这 个 例子 中 ,我 们 把 字符 串 “12345” 变 成 了 一 个 迭代 器 ,这 样 ,再 直接 打印 就 看 不 到 
值 了 ,因为 这 些 值 没 在 内 存 上 ,我 们 可 以 通过 next() 依 次 获取 里 面 的 值 ,也 可 以 通过 for 去 
遍历 , 当 遍 历 过 后 ,实际 已 经 去 除了 所 有 值 ,所 以 再 次 通过 next() 取 值 的 时 候 就 会 抛 出 异常 
StopIteration 停止 迄 代 。 


4.32 实例 : 斐 波 那 契 数列 


斐 波 那 契 数列 (Fibonacci sequence) 又 称 黄 金 分 割 数 列 , 因 数学 家 列 昂 纳 多 。 斐 波 那 契 
以 兔子 繁殖 为 例子 而 引入 , 故 又 称 为 “兔子 数列 ”, 指 的 是 这 样 一 个 数列 : 1、1、2、3、5、8、13、 
21 、34. 这 个 数列 从 第 3 项 开始 ,每 一 项 都 等 于 前 两 项 之 和 。 别 小 看 这 个 看 似 简单 的 数 
列 , 在 现代 物理 、 准 晶体 结构 、 化 学 等 领域 , 斐 波 那 契 数列 都 有 直接 应 用 。 

用 程序 实现 的 方式 很 多 ,其 实 只 要 想 清楚 核心 算法 就 简单 得 多 了 , 纯 算 法 的 解决 方式 
如 下 : 


#feibo while.py 

a=0 

bs 

i=0 

num = int (input ()) 

while i < num: 
print (a) 
ar:b=b,a+b # 核 心算 法 
i+=1 


不 过 , 相 比较 而 言 ,使 用 迭代 会 更 加 高 效 , 下 面 的 例子 会 生成 一 个 列表 : 


#feibo for.py 
numList = [0,1] 
num = int (input ()) 
for i in range (num -2) : 
numList .append (numList[-2] + numList[-1]) 


Print (numList) 
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4.3.3 循环 谋 套 


for 循环 中 也 可 以 戏 套 让 语 句 ,实现 更 灵活 的 程序 。 循 环 的 嵌 套 通 
常 是 指 在 一 个 循环 中 完整 地 包含 另外 一 个 完整 循环 ,也 就 是 循环 体 中 
还 有 循环 。while 和 for 可 以 相互 散 套 。 

比较 典型 的 循环 嵌 套 例子 就 是 通过 for 循环 的 骨 套 打印 九 九 乘法 
表 , 写 这 个 程序 之 前 我 们 先 分 析 一 下 : 

(1) 九 九 乘法 表 由 9 行 组 成 。 

(2) 每 行 的 列 数 有 规律 地 递增 一 列 。 

(3) 表达 式 是 Xx* Y 一 Z。 

(4) X 和 YY 的 值 分 别 由 内 循环 和 外 循环 控制 。 

为 控制 篇 幅 , 下 面 为 六 六 乘法 表 的 代码 : 





#99.py 
for i in range(1, 7): 
for j in range(1，i+ 1) : 
print(j, "x", iy '="', i#*j, '\t', end= '') 
print('\n') 


试 着 调整 将 其 变 成 九 九 乘法 表 的 代码 吧 。 

这 段 程序 中 的 逻辑 关系 : 每 次 外 循环 i 取 值 后 进入 内 循环 ,内 循环 j 的 最 大 值 等 于 i, 内 
循环 全 部 结束 后 回 到 外 循环 i 继续 取 下 一 个 值 ,直到 最 后 。 

程序 中 为 了 控制 打印 效果 ,在 内 循环 结束 前 不 需要 换行 ,而 print() 默 认 是 打印 结束 后 
换行 的 ,也 就 是 end 的 默认 值 是 “\n”, 设 置 为 空 则 不 换行 ,而 每 行 结束 后 需要 换行 ,所 以 有 
最 后 一 行 代码 。 可 以 多 试 试 不 同 的 打印 效果 ,以 便 有 更 直观 的 印象 。 

运行 结果 如 下 : 

1x*x1=1 

1*2=2 2#*2=4 

1l1*3=3 2#*3=6 3*3=9 

lx*x4=4 2x*4=8 3x*4=12 4x*4=16 


1x*5=5 2x*5=10 3x*5=15 4x*5=20 5x*5=25 
1x*6=6 2x*6=12 3x*6=18 4x*6=24 5x*6=30 6x*6=36 


4.3.4 循环 控制 continue 


除了 前 面 介绍 的 break 用 来 提前 结束 循环 ,有 时 只 需要 在 某 个 条 件 下 跳 过 当 次 循环 , 循 
环 继续 。Python 中 提供 的 continue 语句 的 作用 就 是 : 当 循环 遇 到 continue 时 ,程序 终止 当 
前 循环 ,并 忽略 continue 之 后 的 所 有 语句 ,然后 回 到 循环 顶端 继续 下 一 次 循环 。 一定 要 注 
意 continue 和 break 的 区 别 : break 是 终止 整个 循环 ,continue 只 是 忽略 当 次 循环 的 剩余 
语句 。 

打印 所 有 500 以 内 可 以 被 36 整除 的 整数 ,代码 如 下 : 


A 
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#continue36.py 
s=0 
for i in range(1,501): 
if i%36 1=0: 
continue 
print(i,end=" ") 
s+=1 


结果 如 下 : 

36 72 108 144 180 216 252 288 324 360 396 432 468 

这 段 程序 也 可 以 改 成 不 用 continue, 请 你 试 一 下 ,会 发 现 正好 思路 相反 。 
[ 旺 重点 提示 


在 这 一 章 中 ,你 要 掌握 的 内 容 : 

(1) 会 使 用 计 语 名 配合 各 种 布尔 值 和 逻辑 运算 符 完 成 复杂 的 分 支 语句 。 
(2) 明确 while 和 for 循环 的 用 法 及 区 别 。 

(3) 掌握 循环 的 控制 方法 。 


7 动 动手 


(1) 用 for 循环 实现 1~100 所 有 数 的 总 和 。 

(2) 已 知 10 以 内 是 3、5 倍数 的 数字 为 3、5、6、9, 其 和 为 23。 通 过 程序 求 出 1000 以 内 
所 有 为 3、5 倍数 的 数字 的 和 ,参考 结果 为 233168。 

(3) Collatz 猜想 (冰雹 序列 ) 。 

按 下 面 的 规则 生成 以 1 结束 的 序列 ， 

若 数字 是 偶数 , 除 以 2; 若 数字 是 奇数 , 乘 以 3 再 加 1; 当 数 等 于 1 时 ,退出 程序 。 

例如 ,从 5 开始 ,得 到 序列 : 5,16,8,4,2,1。 

程序 效果 : 用 户 输 入 一 个 数字 , 列 出 冰 震 序列 。 





列表 和 元 组 


序列 是 程序 设计 中 常用 的 数据 存储 方式 ,除了 前 面 介绍 的 字符 串 (string) ,Python 中 提 
供 的 另外 两 种 序列 类 型 就 是 列表 (list) 和 元 组 (tuple) , 相 比 字符 串 ,列表 和 元 组 能 够 存储 的 
内 容 更 丰富 、 更 灵活 多 样 。 

Python 所 提供 的 序列 类 型 能 够 实现 的 功能 在 所 有 程序 设计 语言 中 是 最 强大 的 ,有 时 其 
至 超出 了 简单 的 数据 框架 。 


> 生长 图 〈( 英 礁 无 敌 》》 迁 代 开 发 : 构建 英雄 世界 


学 习 列 表 之 前 , 先 看 一 下 在 (英雄 无 敌 ) 这 个 游戏 中 接 下 来 要 解决 加 
的 问题 。 经 过 前 面 的 学 习 , 我 们 已 经 可 以 控制 程序 的 流程 了 ,但 相信 还 
有 很 多 你 觉得 整 脚 或 无 法 实现 的 效果 。 

现在 先 放下 你 要 成 为 一 个 优秀 程序 员 的 想法 ,专注 于 一 个 程序 的 
诞生 过 程 。 

首先 ,应 该 没有 人 像 诗 人 一 样 突 然 灵感 爆发 一 气 呵 成 写 出 一 个 程 
ep 定 有 过 深思 熟 虑 的 积累 才能 爆发 。 通 常 程序 
开发 的 前 期 需要 进行 需求 分 析 , 比如 《英雄 无 敌 》 这 个 游戏 要 实现 的 功能 、 要 呈现 的 效果 等 ， 
把 它们 列 出 来 。 

《英雄 无 敌 ) 初 步 需求 : 

(1) 注册 、 登 录 、 验 证 。 

(2) 给 角色 起 个 名 字 , 初 始 化 英雄 。 

(3) 游戏 的 前 奏 。 

(4) 满 血 出 场 。 

(5) 有 地 图 。 

(6) 发 生 随 机 事件 。 

有 了 需求 ,就 可 以 开始 琢磨 整个 程序 的 框架 了 ,如 整个 流程 的 控制 ,功能 的 设计 等 ,最 
后 才 是 开始 编写 代码 ,这 时 候 代码 可 能 已 经 在 脑子 里 是 个 草稿 了 , 写 出 来 之 后 还 要 经 过 反 
复 测试 和 调试 。 不 过 ,即便 可 以 成 功 运行 ,也 不 要 高 兴 得 太 早 , 可 能 需求 这 时 候 又 变 了 。 程 
序 写 完 了 ,需求 又 变 了 ? 嗯 ,程序 员 永 远 不 知道 客户 和 产品 经 理会 有 什么 想法 , 这 也 是 大 家 





《英雄 无 敌 ) 迭 代 开 
发 : 构建 英雄 世界 
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经 常 开玩笑 说 程序 员 和 产品 经 理 “ 势 不 两 立 ” 的 原因 。 还 好 现在 不 用 担心 ,因为 现在 你 是 身 
兼 所 有 职位 在 开发 项 目 。 那 么 在 这 个 需求 当中 ,列表 和 元 组 有 什么 作用 呢 ? 别 急 , 往 下 看 。 


> 下- 区 二 程序 中 的 数据 仓库 : 列表 


作为 序列 类 型 的 列表 (lisb , 跟 字 符 串 相 比 , 相 同 的 是 所 有 关于 序 ” 国 
列 的 操作 都 是 通用 的 。 不 同 的 有 两 个 方面 : 四 字符 串 中 的 值 只 能 是 字 世 
符 , 在 列表 中 值 可 以 是 任何 类 型 ,我 们 称 列表 中 的 值 为 元 素 或 列表 项 ;< 
@ 列 表 是 可 变 类 型 , 即 列表 中 的 元 素 是 可 以 改变 的 ,甚至 可 以 作为 程序 
中 的 数据 库 使 用 ,后 面 会 有 详细 说 明 。 

明确 了 两 者 的 异同 ,就 可 以 套用 已 知 的 字符 串 知识 快速 掌握 列 
表 了 。 


5.2.1 创建 列表 


Python 中 创建 列表 的 方法 很 多 ,最 基本 的 创建 形式 就 是 通过 方 括号 [], 其 中 所 有 的 元 
素 通过 逗号 分 隔 开 。 另 外 ,还 可 以 通过 list() 函数 创建 列表 ,具体 看 一 下 在 Python 会 话 中 
的 几 个 示例 : 






F 尼 口 六 
国 世 二 站 


列表 的 创建 和 基本 操作 


>>>aList = [] 
>>>numList = [1,2,3,4,5] 
>>>hero = ['milo',100,'hero'] 


>>>1istInList = [1,2,3,['a','b','c']] 

>>>hwList = list('hello world') 

>>>hero 

['milo', 100, 'hero'] 

>>>hwList 

Fp er 
>>>type (aList) 

<class 'list'> 

>>> 


上 面 的 示例 创建 了 几 个 形式 各 异 的 列表 ,分 别 来 看 一 下 : 

(1) aList 是 一 个 空 列表 ,里 面 没有 数据 ,不 过 这 样 的 空 列表 在 程序 设计 过 程 中 会 经 常 
用 到 ,比如 有 时 候 要 通过 循环 或 遍历 构建 一 个 新 列表 ,这 时 就 可 以 先 建 一 个 空 列表 ,然后 再 
把 生成 的 值 添加 进来 。 

(2) numList 是 一 个 纯 数字 的 列表 ,所 有 整数 用 逗号 隔 开 。 

(3) hero 混合 了 两 种 类 型 的 元 素 。 

(4) listInList 是 一 个 列表 中 又 包含 了 另 一 个 列表 ,这 种 我 们 称 之 为 二 元 列表 。 

(5) hwList 是 通过 list() 函数 将 一 个 字符 串 转 化 成 列表 ,每 一 个 字符 是 一 个 元 素 , 需 要 
注意 的 是 , 非 集合 类 型 (数字 布尔 值 ) 的 数据 类 型 不 能 用 list() 函数 转化 为 列表 。 
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522 列表 拆 分 
列表 可 以 通过 赋值 的 方式 进行 拆 分 ,用 法 如 下 : 


>>>hero = ['milo',100,200] 
>>>name, act, hp = hero 
>>>name 

'milo' 

>>>act 

100 

>>>hp 

200 


> 正二 让 列表 的 序列 化 操作 


列表 有 非常 丰富 的 相关 操作 ,这 也 是 列表 功能 强大 的 原因 。 不 过 ,好 在 有 些 操作 是 序 
列 通用 的 ,比较 好 记 , 比 如 序列 相关 ;有 些 功能 性 非常 明显 ,比如 数据 的 增删 修改 。 下 面 先 


讲 跟 字符 串 相 同 的 一 些 操作 。 
5.3.1 索引 和 切片 


读 取 列表 元 素 的 方式 就 是 变量 名 加 索引 ( 方 括号 中 ), 因 为 列表 与 字符 串 同属 序列 ,所 
以 ,在 列表 操作 过 程 中 也 有 索引 和 切片 ,而 且 用 法 完全 一 样 , 只 是 列表 中 的 元 素 更 丰富 了 。 


例如 : 


>>>hero = ['milo',100,'hero'] 
>>>hero[0] 

'milo' 

>>>hero[1] 

100 


通过 索引 ,除了 读 取 元 素 , 也 可 以 直接 对 指定 索引 的 元 素 重 新 赋值 。 
二 元 列表 的 读 取 方式 : 


>>>1istInList = [1,2,3,['a', 'b','c']] 
>>>1istInList[3] 

| 

>>>1istInList[3] [1] 

‘bp! 


这 里 ,listInList 列表 中 有 4 个 元 素 , 其 中 第 4 个 元 素 也 是 个 列表 。 


需要 注意 的 是 ,列表 用 方 括号 表示 , 读 取 索 引 也 用 方 括号 表示 ,例如 : 


>>> [1,2,3,4,5] [-1] 
本 
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车 这 个 表达 式 弄 明白 了 ,说 明 你 对 列表 已 经 理解 了 。 这 个 例子 将 列表 的 创建 和 索引 操 
作 放 在 了 一 起 ,我 们 要 从 左 向 右 阅 读 表达 式 , 左 边 创 建 列表 ,右边 是 这 个 列表 的 索引 。 
最 后 ,需要 注意 索引 越界 的 问题 ,例如 : 


>>> [1,2,3,4,5] [5] 
Traceback (most recent call last): 
File "<pyshell#16>", line 1, in <module> 
[1,2,3,4,5] [5] 
IndexError: list index out of range 


明确 了 索引 的 运用 , 接 下 来 就 是 切片 了 ,具体 参照 字符 串 中 的 切片 操作 ,示例 如 下 : 


>>>hwList = list('hello world') 

>>>numList = [1,2,3,4,5] 

>>>hwList 

Lr re dy 
>>>hwList[::2] 

Lr on wr rg 


5.32 运算 符 及 函数 
字符 串 的 重复 ( * ) ,拼接 (十 ) \in 和 not in 在 列表 上 的 使 用 效果 是 一 样 的 ,示例 如 下 : 


>>>aList = [1,2,3] 
>>>brist = la DC 
>>>aList + bList 
[| 
>>>aList * 3 

[1, 2, 3, 1, 2, 3, 1, 2, 3] 
>>>3 in aList 

True 

>>>'d' not in bList 
True 


另外 ,也 可 以 用 二 <、 二 二、 二 二、 这 = 和! 二 比较 两 个 列表 ,不 过 ,因为 列表 元 素 类 型 
比较 多 样 ,应 使 用 同一 类 型 的 元 素 ( 全 数字 或 全 字符 串 ) ,避免 不 同类 型 的 比较 ,示例 如 下 : 


S25> [172737r2a) < [7273r475] 
True 
>>>i[17273r4] < [1,2,3,"'a'] 
Traceback (most recent call last): 
File "<pyshell#26>", line 1, in <module> 
[1,2,3,4] < [1,2,3,'a'] 
TypeError: '<' not supported between instances of 'int' and 'str' 
>>> 


还 有 一 些 关 于 序列 的 通用 函数 是 可 以 用 于 字符 串 、 列 表 和 元 组 的 。 
(1) len() 函 数 用 于 获取 序列 的 元 素 个 数 : 
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>>>1en([1,2,3,4,5]) 
5 

>>>1len ("abcde") 

1 


(2) max( 〇 函数 和 min() 函 数 返 回 序列 中 元 素 的 最 大 值 和 最 小 值 : 


>>>max ([1,4,6,8,5,3,2,9]) 
加 
>>>min([1,4,6,8,5,3,2,9]) 
1 

>>>max ('12345') 

151 

>>>min('12345') 

对 说 


(3) sum() 函 数 对 数值 型 列表 元 素 求 和 , 非 数 值 则 报错 : 


>>> sum([1,2,3,4,5]) 
15 
>>>sum([1,2,3,4,5,'6']) 
Traceback (most recent call last): 
File "<pyshell#38>", line 1, in <module> 
sum([1,2,3,4,5,'6']) 
TypeError: unsupported operand type(s) for + : 'int' and 'str' 


(4) sorted() 函 数 对 序列 进行 排序 ,reversed() 函 数 可 以 直接 将 序列 倒序 排列 : 


>>>1 = [idr776r2759] 

>>> sorted (1) 

[1, 2, 4, 6, 7, 9] 

>>>reversed(1) 

<list reverseiterator object at 0x060D7B10> 
>>>next (reversed (1)) 

a 


注意 : reversed() 函数 返回 的 是 一 个 迭代 器 ,需要 遍历 或 调用 next() 函 数 。 
5.3.3 遍历 


在 for 循环 中 ,已 经 介绍 过 通过 range() 函数 生成 一 个 列表 迭代 器 的 方法 ,现在 有 了 列 
表 ( 列 表 跟 字符 串 一 样 是 序列 ) ,当然 就 可 以 通过 for 直接 遍历 了 (reversed() 函数 也 可 以 ) : 


>>>fo0r i in la br nce ls 
print (i) 


Lo 


A 
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>>>for i in range(len(['a', 'b','c'])): 


print (i) 


[9 


[> 丰茂 由 列表 的 操作 


我 们 说 列表 时 总 会 
能 把 字符 串 指定 索引 位 置 的 字符 变 成 其 他 字符 ,而 列表 完全 可 以 修改 ， 
甚至 可 以 增加 和 删除 元 素 , 用 起 来 就 像 数 据 库 一 样 ,而 且 也 确实 经 常会 
把 列表 当 作 一 个 临时 数据 库 来 用 。 说 临时 是 因为 列表 的 增 、 删 \ 改 、 查 
都 只 是 在 你 的 一 个 程序 中 ,程序 运行 结束 后 并 不 会 保存 下 来 。 


5.4.1 可 变 的 列表 


说 它 是 可 变 的 , 跟 字符 串 相 比 ,其 实 就 是 指 你 不 





列表 常用 方法 


列表 的 可 变性 非常 有 用 ,可 以 仅仅 通过 索引 或 切片 来 替换 列表 的 元 素 甚 至 来 个 大 换 
血 , 正 因为 这 样 , 更 要 避免 无 意 的 操作 带 来 的 失误 。 下 面 是 具体 的 改变 列表 的 方式 。 


>>>role = ['milo',100,200,'hero'] 
>>>role[0] 

'milo' 
>>>role[0] = 'zouqixian' # 改 变 第 一 个 元 素 
>>>role 

'zouqixian', 100, 200, 'hero'] 
>>>role[-1] = 'monster' # 改 变 最 后 一 个 元 素 
>>>role 

'zouqixian', 100, 200, 'monster'] 
>>>role[1:3] = [2000] # 第 二 到 第 三 个 元 素 蔡 换 为 一 个 元 素 
>>>role 


>>>role 








1, 2, 3, 4, 5, 6] 
>>>role[:] = "hello world!"  # 将 列表 指定 元 素 蔡 换 为 字符 串 字 符 


'zouqixian', 2000, 'monster'] 


>>>role[:] = [1,2,3,4,5,6] # 遍 有 历 列 表 蔡 换 为 全 新 的 元 素 


>>>role 
pa ST ET SET 
>>>role[:] = 12345 # 上 个 操作 仅 限 可 迭代 数据 ,整数 不 可 迭代 


Traceback (most recent call last): 
File "<pyshell#75>", line 1, in <module> 
role[l:] = 12345 
TypeError: can only assign an iterable 


在 这 个 例子 中 ,所 有 操作 都 是 通过 指定 列表 索引 进行 赋值 实现 的 ,每 个 操作 都 对 列表 
的 值 进行 了 修改 , 即 每 次 对 列表 标签 (变量 名 ) 所 对 应 数据 空间 的 内 部 数据 都 进行 了 修改 。 
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在 这 个 过 程 中 因为 赋值 语句 不 会 有 返回 值 ,所 以 每 次 都 通过 变量 名 来 查看 结果 。 我 们 可 以 
改变 一 个 元 素 , 也 可 以 改变 所 有 的 元 素 , 唯 一 需要 注意 的 是 被 添加 的 元 素 必 须 是 一 个 集合 
类 型 ,集合 中 的 每 个 元 素 作为 元 素 单独 添加 到 列表 中 。 


5.4.2 ”列表 的 方法 


针对 列表 的 操作 得 益 于 列表 对 象 的 方法 ,就 像 字符 串 类 型 拥有 大 量 的 方法 一 样 。 列 表 
的 所 有 方法 也 可 以 通过 help(list) 看 到 。 我 们 按 实现 的 效果 来 看 一 下 。 


1. 检索 元 素 


通过 索引 获得 列表 的 元 素 , 通 过 列表 的 index(x) 方 法 可 以 返回 x 元 素 的 索引 ,如 果 元 
素 不 存在 , 则 报错 。 
通过 count(x) 可 以 返回 列表 中 x 出 现 的 次 数 ,x 是 一 个 元 素 。 


>>>role = ['milo',100,200,'hero'] 

>>>role.index ('hero') 

3 

>>>role.count (0) #0 这 个 数字 出 现 了 4 个 ,但 是 没有 这 个 单独 的 元 素 
0 

>>>role.count (100) #100 出 现 了 1 次 

全 

>>> 


2. 增加 元 素 
append() 方 法 可 以 向 列表 尾部 添加 一 个 新 的 元 素 


>>>role.append('level2') 
>>>role 
['milo', 100, 200, 'hero', 'level2'] 


extend() 方 法 可 以 将 另 一 个 列表 的 元 素 添加 到 当前 列表 (这 个 跟 通 过 十 号 合并 两 个 列 
表 是 有 区 别 的 ,后 面 会 详细 讲解 ): 


>>>bag = ['AK47','knife',100] 

>>>role.extend (bag) 

>>>role 

['milo', 100, 200, 'hero', 'level2', 'AK47', 'knife',100] 


insert() 方 法 可 以 根据 索引 将 一 个 元 素 插 入 到 列表 的 任何 位 置 ,这 个 方法 需要 两 个 参 
数 , 第 一 个 是 位 置 , 即 索引 ,第 二 个 是 需要 插入 的 元 素 : 


>>>role 
['generral', 'milo', 100, 200, 'hero', 'level2', 'AK47', 'knife',100] 


A 
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3. 删除 元 素 
remove() 方 法 可 以 删除 一 个 指定 值 的 元 素 , 如 果 有 多 个 , 则 从 左 至 右 依次 执行 : 


>>>role.remove (100) 

>>>role 

['generral', 'milo', 200, 'hero', 'level2', 'AK47', 'knife', 100] 
>>>role.remove (100) 

>>>role 

['generral', 'milo', 200, 'hero', 'level2', 'AK47', 'knife'] 


如 果 想 弹出 指定 位 置 的 元 素 , 可 以 用 pop(), 弹 出 的 意思 指 删 除 的 同时 ,这 个 值 会 返回 
给 调用 者 : 


>>>role 

['generral', 'milo', 200, 'hero', 'level2', 'AK47', 'knife'] 
>>>role.pop(-2) 

'AK47' 

>>>bag = role.pop(-1) 

>>>role 

['generral', 'milo', 200, 'hero', 'level2'] 

>>>bag 

'knife' 


如 果 不 需要 返回 值 又 想 根据 索引 删除 ,可 以 使 用 Python 的 del 语句 ,del 语句 和 切片 结 
合 就 可 以 删除 多 个 元 素 了 : 


>>>del role [0] 

>>>role 

['milo', 200, 'hero', 'level2'] 
>>>del role[1:] 

>>>role 

['milo'] 


5.4.3 字符 串 和 列表 


我 们 在 3.4 节 介 绍 过 字符 串 方法 split() ,可 以 把 字符 串 按 指定 参数 (默认 是 空白 ) 分 隔 
并 返回 一 个 列表 ,以 及 通过 字符 串 方法 join() 将 列表 拼接 成 字符 串 。 可 以 参考 字符 串 章 节 
相关 内 容 , 这 里 不 再 袭 述 。 


Python 的 魔术 


先 看 一 个 过 滤 (filter) 列 表 的 例子 。 
已 知 10 以 内 为 3、5 倍数 的 数字 为 3、5、6、9, 其 和 为 23 , 求 1000 以 内 所 有 为 3、5 倍数 的 
数字 的 和 。 这 个 问题 的 解决 方法 很 多 , 求 10 以 内 的 ,可 采取 下 面 的 办 法 : 
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>>>numList = [] 
>>>for i in range(1,10): 
1if i%3==0 or i%5 ==0: 
numList.append (i) 





>>>numList 

[3, 5, 6, 9] 

>>> sum (numList) 
23 


列表 解析 和 生成 表达 式 


当然 ,这 只 是 寻常 的 方法 , 下 面 我 们 要 看 看 神奇 的 Python 怎样 求解 1000 以 内 所 有 为 
3.5 倍数 的 数字 的 和 。 


5.5.1 列表 推导 式 


列表 推导 式 (list comprehensions) 是 Python 中 很 强大 的 、 很 受 欢 迎 的 特性 ,具有 语言 
洁 、 速 度 快 等 优点 。 具 体 作 用 是 通过 一 个 序列 生成 一 个 新 的 列表 。 
列表 推导 式 的 语法 为 


[表达 式 for 变量 in 列表 ] 

[表达 式 for 变量 in 列表 if 条 件 ] 

表达 式 :列表 生成 元 素 表达 式 , 可 以 是 有 返回 值 的 函数 。 

for 变量 in 列表 :和 迭代 列表 将 元 素 传人 表达 式 中 ,如 果 有 if, 则 先 交 给 if 进行 过 滤 。 
if 条 件 :根据 条 件 过 滤 


基本 的 用 法 举例 如 下 : 


>>>1st = [2,6,3,5,9] 

>>> [xx #2 for x in lst] # 求 所 有 元 素 的 平方 
[a 36 9 25 

>>> [x for x in lst if x%2 == 0] # 过 滤 出 偶数 
[2，6] 


由 此 ,3、5 倍数 的 例子 用 列表 推导 式 只 要 一 行 代 码 就 可 以 了 : 


>>> [i for i in range(1,10) if i%3==0 or i%5==0] 

[3, 5, 6, 9] 

>>>sum([i for i in range(1,1000) if i%3==0 or i%5 == 0]) 
233168 


怎么 样 ,是 不 是 看 起 来 好 像 变 魔术 。 
5.52 生成 器 表达 式 


生成 器 (generator) 是 一 种 特殊 的 迭代 器 , 它 的 工作 方式 是 每 次 处 理 一 个 对 象 ,而 不 是 
一 口气 处 理 和 构造 整个 数据 结构 ,这样 做 的 潜在 优点 是 可 以 节省 大 量 内 存 。 

生成 器 表达 式 (generator expression) 并 不 真正 创建 列表 ,而 是 返回 一 个 生成 器 ,生成 器 
表达 式 语法 结构 和 列表 表达 式 一 样 ,区 别 在 于 表达 式 使 用 () 括 起 来 ,而 不 是 []。 上 面 的 例 
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子 可 以 直接 变 成 生成 器 表达 式 。 


>>>1st = [2,6,3,5,9] 
>>> (x* * 2 for x in lst) 
<generator object <genexpr>at 0x061017E0> 


这 时 可 以 看 到 返回 值 不 是 列表 了 ,可 以 采取 迭代 的 方式 获取 生成 器 的 值 : 


>>>1st = [2,6,3,5,9] 

>>>g = (x* *2 for x in lst) 
>>>type (9g) 

<class 'generator'> 
>>>next (g) 

4 


3、5 倍数 用 生成 器 表达 式 就 变 成 了 


>>>sum( (i for i in range(1,1000) if i%3 == 0 or i%5 == 0)) 
233168 


可 能 会 有 人 问 只 是 换 了 个 符号 ,意义 是 什么 ? 这 就 要 回 到 迭代 器 上 考虑 了 ,迭代 器 最 
大 的 优点 是 可 以 节省 大 量 的 内 存 。 


5.5.3 一 点 建议 


虽然 列表 推导 式 和 生成 器 表达 式 很 方便 ,但 并 不 是 任何 时 候 都 可 以 用 ,有 如 下 几 个 
建议 。 

(1) 当 只 执行 一 个 循环 就 可 以 时 ,尽量 使 用 循环 而 不 是 列表 解析 ,这 样 更 符合 Python 
提倡 的 直观 性 。 因 为 列表 推导 式 有 的 时 候 并 不 易 读 。 

(2) 当 有 内 建 的 操作 或 者 类 型 能 够 以 更 直接 的 方式 实现 的 ,不 要 使 用 列表 解析 。 例 如 
复制 一 个 列表 时 ,使 用 L1=list(L) 即 可 ,不 必 使 用 Ll==[x for x in Lj]。 

(3) 如 果 需 要 对 每 个 元 素 都 调用 并 且 返 回 结果 时 ,应 使 用 LI 一 map(f,L)， 而 不 是 LI 一 
Lf(x) for x in L], 像 map() 这 样 的 函数 还 有 很 多 ,将 在 第 6 章 介 绍 。 


(> 帮 肖 叶 深 拷贝 、 浅 拷贝 


我 们 一 直 在 说 列表 是 可 变 的 ,有 时 还 希望 对 列表 做 备份 ,这 就 涉及 拷贝 ,会 有 一 些 有 意 
思 或 者 让 新 手头 疼 的 问题 ,在 此 ,通过 一 些 非常 简单 直观 的 例子 来 讲解 。 下 面 跟 着 我 的 思 
路 做 一 遍 应 该 就 能 明白 了 。 


5.6.1 赋值 
首先 看 一 下 字符 串 , 来 作为 对 比 : 


S1 = "hello world" 
>>>s2= sl 
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>>>S2 

"hello wor1ld' 
>>>S1= 1 
>>>s1 

1 


代码 中 定义 了 字符 串 sl ,然后 s2 一 s1, 相 当 于 sl 的 数据 增加 了 一 个 名 字 , 所 以 通过 s2 
访问 到 的 数据 就 是 s1 对 应 的 数据 ,最 后 给 sl 赋值 为 空 字符 串 ,此 时 s2 的 值 为 


>>>s2 
'hello world' 


这 里 新 手 会 犯 一 个 错误 ,可 能 会 认为 s2 会 随 着 sl 的 改变 而 改变 ,但 实际 上 s2 的 值 并 
没有 改变 ,原因 在 介绍 变量 时 已 经 说 过 ,sl 和 s2 都 是 数据 的 标签 , 当 执行 sl=' 时 ,实际 相 
当 于 将 sl 这 个 标签 移动 到 了 数据 '' 上 ,而 s2 并 没有 移动 ,数据 当然 不 会 改变 。 

你 可 能 会 问 ,这 有 什么 意义 ? 接 下 来 就 是 关于 列表 的 可 变 特性 ,请 看 下 面 的 例子 : 


>>>11 = ['hello', 'world'] 
>>>12=11 

>>>12 

['hello', 'world'] 

>>>del 11[:] 

>>>11 

[] 


跟 上 面 的 例子 类 似 , 只 是 字符 串 变 成 了 列表 ,并 且 删 除 1 所 有 元 素 ,12 的 值 为 


>>>12 
[] 


想到 了 吗 ? 12 的 值 也 清空 了 , 别 急 ,再 看 一 步 : 


>>>11 = ['hello', 'world'] 
>>>11 
['hello', 'world'] 


11 再 赋值 ,12 会 怎样 ,同样 获得 值 吗 ? 


>>>12 


[] 


什么 原因 呢 ? 首先 明确 一 点 ,在 Python 中 ,sl 二 s2 和 11 = 12 是 一 样 的 ,都 是 给 对 象 
添加 新 的 名 字 。 但 是 为 什么 列表 的 值 被 改变 的 时 候 , 另 一 个 名 字 所 对 应 的 值 也 变 了 呢 ? 这 
是 因为 创建 列表 时 数据 的 存储 方式 ,我们 看 一 下 11 二 12 之 后 的 情况 ,如 图 5-1 所 示 。 

从 这 个 结构 表 中 可 以 看 出 ,ll 和 12 使 用 的 是 同一 个 存储 空间 ,所 以 这 时 我 们 通过 任何 
一 个 名 字 对 值 进行 改变 , 另 一 方 所 访问 的 空间 都 不 变 , 获 取 的 值 当然 不 变 。 而 当 我 们 第 二 
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次 执行 11 一 [hello'，'worldJ] 时 ,实际 上 是 将 11 这 个 名 字 移 动 到 一 个 新 的 列表 对 象 上 ,如 
图 5-2 所 示 。 




























































































列表 元 素 的 存储 空间 (2) 
“hello” “world” 
列表 元 素 的 存储 空间 (1) 列表 元 素 的 存储 空间 (1) 
“hello™ “world™ 
图 5-1 引用 图 5-2 重新 赋值 


综 上 所 述 ,关于 Python 中 赋值 操作 的 效果 如 下 。 

(1) 赋值 是 将 一 个 对 象 的 地 址 赋值 给 一 个 变量 ,让 变量 指向 该 地 址 ( 旧 瓶 装 旧 酒 )。 
(2) 修改 不 可 变 对 象 (str、tuple) 需 要 开辟 新 的 空间 。 

(3) 修改 可 变 对 象 (list 等 ) 不 需要 开辟 新 的 空间 。 


5.62 浅 拷贝 


Python 提供 了 一 个 copy 模块 ,其 中 的 copy() 方 法 可 以 实现 浅 拷贝 , 浅 拷贝 仅仅 复制 容 
器 中 元 素 的 地 址 ,效果 如 下 : 


>>> import copy 

>>>a = ['hello', [1,2,3]] 
>>>b = copy.copy (a) 
>>> [id (x) for x in a] 
[65592207, 5623045] 
>>> [id (x) for x in b] 
[65592207, 5623045] 
>>>a[0] = 'world' 
>>>a[1] .append (4) 
>>>print (a) 

['worid', [1, 2, 3, 4]] 
>>>print (b) 

['hello', [1, 2, 3, 4]] 


在 本 例 中 ,经 过 浅 拷贝 之 后 的 副本 ,在 做 修改 之 前 元 素 的 地 址 是 相同 的 ,此 时 浅 拷贝 只 
是 将 源 列 表 中 元 素 的 地 址 复制 了 一 份 , 修 改 a 列表 内 的 不 可 变 元 素 字 符 串 时 移动 了 地 址 ， 
b 不 跟着 改变 ,而 可 变 的 列表 元 素 则 在 内 部 增加 了 值 ,a 和 的 这 个 列表 元 素 地 址 相同 ,所 
以 同时 变化 。 

综 上 所 述 , 浅 拷贝 是 在 另 一 块 地 址 中 创建 一 个 新 的 变量 或 容器 ,但 是 容器 内 元 素 的 地 
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址 均 是 源 对 象 元 素 的 地 址 的 拷贝 。 即 新 的 容器 中 指向 了 旧 的 元 素 。 
最 后 ,除了 copy 模块 ,还 可 以 通过 切片 操作 、 工 厂 函 数 list()、 对 象 的 copy() 方 法 等 实 
现 浅 拷贝 ; 


>>>a = [1,2,3,4] 
>>>b =a[:] 
>>>c = 1ist (a) 
>>>d = a.copy() 


5.6.3 深 拷 贝 
深 拷贝 的 方法 是 copy. deepcopy() ,完全 拷贝 一 个 副本 ,容器 内 部 元 素 地 址 都 不 一 样 


>>>from copy import deepcopy 

>>>a = ['hello', [1,2,3]] 

>>>b = deepcopy (a) 

>>> [id(x) for x in a] [46952708, 66053004] 
>>> [id (x) for x in b] [48657389, 66028736] 
>>>a[0] = 'world' 

>>>a[1] .append (4) 

>>>print (a) 

['world'’, [1, 2, 3, 4]] 

>>>print (b) 

['hello', [1, 2, 3]] 


在 这 个 例子 中 可 以 很 明显 地 看 到 , 深 拷 贝 后 的 对 象 地 址 和 元 素 的 地 址 都 不 同 , 可 以 看 
作 是 值 相同 的 完全 拷贝 的 副本 ,不论 原 对 象 怎么 修改 都 不 会 影响 深 拷贝 。 
用 图 5-3 示意 浅 拷贝 和 深 拷 贝 。 








创建 对 象 























Value 


5-3” 浅 拷贝 和 深 拷 贝 
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> 直方 有 不 可 变 的 列表 一 一 元 组 


元 组 可 以 看 作 是 不 可 变 的 列表 。 元 组 几乎 具备 列表 所 有 的 特征 ， 
不 同 的 是 元 组 一 旦 创建 就 不 可 改变 ,不 能 更 改元 素 , 也 不 能 增 减 元 素 。 

因为 元 组 跟 列表 相似 ,所 以 ,除了 更 改元 组 元 素 , 你 可 以 尝试 所 有 
的 列表 操作 ,下 面 我 们 从 区 别 于 列表 的 一 些 特性 了 解 一 下 元 组 。 


5.714 创建 元 组 


元 组 是 用 逗号 分 隔 的 一 组 值 , 这 个 值 可 以 是 任何 类 型 的 对 象 ,创建 元 组 时 可 以 不 用 括 
号 ,但 通常 我 们 会 用 〇 将 所 有 元 素 括 起 来 ,以 区 别 于 列表 的 [] ,如 下 : 





不 可 变 的 元 组 和 
灵活 的 列表 


>>> tle (lr 27 37 ap brn er) 
Ed fd he 
>>>t1 

ee 

>>>t2 

(1, 2, 3, ‘a', 'b' 'c') 


这 里 需要 注意 一 点 ,介绍 元 组 时 经 常会 有 一 个 误区 ,说 元 组 的 创建 符号 是 ()。 实 际 上 
真正 创建 元 组 的 运算 符 是 逗号 ,Python 中 圆 括号 大 多 数 情况 下 表示 分 组 , 圆 括号 加 上 逗号 
才 成 为 元 组 创建 的 一 部 分 ,比如 创建 一 个 只 有 一 个 元 素 的 元 组 , 若 只 有 括号 没有 逗号 , 则 跟 
元 组 一 点 关系 也 没有 ,如 下 : 


>>>t3= 1， 
>>>t3 

(1,) 

>>>t4=1 
>>>t4 

1 

>>>t5= (1,) 
>>>t5 

(1,) 

>>>t6= (1) 
>>>t6 

L 

>>>type (t3) 
<class 'tuple'> 
>>>type (七 4) 
<class 'int'> 
>>>type (t5) 
<class 'tuple'> 
>>>type (t6) 
«<class "int"> 
>>> 
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还 有 一 种 特殊 的 元 组 就 是 空 元 组 ,如 下 : 


>>>t7= () 
>>>t8 =tuple() 
>>>t7 

() 

>>>t8 

() 


tuple() 的 另 一 个 作用 就 是 将 其 他 序列 转 为 元 组 : 


>>>t9= tuple("hello") 
>>>t9 

{hy ron re ra or) 
>>> 


5.72 元 组 赋值 


元 组 除了 可 以 把 一 组 数据 赋值 给 一 个 变量 ,还 可 以 进行 拆 分 赋值 ,比如 这 个 经 典 的 算 
法 问题 有 红 墨 水 和 蓝 墨 水 各 一 杯 , 问 怎样 将 杯 中 墨水 交换 ? 解决 办 法 就 是 再 找 一 个 空 杯 
做 中 转 ,用 传统 的 赋值 方式 表示 如 下 : 


>>>red = "red water" 
>>>blue = "blue water" 
>>>temp = red 

>>>red =blue 

>>>blue = temp 


这 个 办 法 在 Python 中 就 显得 不 那么 简洁 优雅 了 ,在 Python 中 ,我 们 可 以 这 样 : 
>>>red, blue =blue, red 


这 种 等 号 左右 都 是 元 组 的 方式 就 是 元 组 拆 分 ,这 种 赋值 方式 需要 注意 的 是 左边 变量 数 
跟 右 边 元 组 的 元 素数 要 相等 。 


5.7.3 ”列表 和 元 组 


列表 和 元 组 是 可 以 相互 转换 的 ,各 自 都 提供 了 转换 函数 list() 和 tuple()。 除 了 相互 转 
换 之 外 ,还 有 一 种 情况 会 把 两 者 结合 在 一 起 。 

Python 提供 了 一 个 内 置 函 数 zip() ,作用 是 接收 多 个 序列 ,每 个 序列 取 一 个 值 放 到 一 个 
元 组 里 ,在 Python 2 中 所 有 的 元 组 组 成 一 个 列表 ,在 Python 3 中 不 能 直接 看 到 这 个 列表 ， 
zip() 返 回 一 个 迭代 器 ,需要 迭代 才能 看 到 里 面 的 值 。 如 果 序 列 长 度 不 同 , 则 以 短 的 为 准 : 

>>>X = 'xyz" 


>>>1 = [1,2,3,4] 
>>>zip(x, 1) 


(ol 》 
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<zip object at 0x05450B48> 
>>>for i in zip(x,1): 
print i 


Cee 
('y', 2) 
tz 3 


迭代 时 ,可 以 利用 元 组 赋值 方式 直接 拆 分 元 组 : 


>>>for v, k in zip(x,1): 


print (k, "===>", Vv) 
1 ===>x 
2 ===>y 
3 ===>2Z 


这 种 组 合用 来 解决 某 些 问题 是 很 有 用 的 ,比如 判断 两 个 序列 当中 是 否 在 同一 位 置 含有 
相同 元 素 : 


22> £0r x; Y An zip(11, 12)3 
if x ==y: 
print (x) 


5.74 什么 时 候 使 用 元 组 


元 组 与 同 为 序列 的 字符 串 和 列表 ,应 该 根据 什么 决定 是 否 使 用 元 组 呢 ? 

首先 是 字符 串 , 相 比 其 他 序列 ,字符 串 的 限制 比较 多 ,元素 只 能 是 字符 而 且 不 可 变 。 

列表 是 最 灵活 的 , 相 比 元 组 ,用 到 的 地 方 更 多 一 些 ,所 以 本 书 用 了 较 大 篇 幅 介 绍 。 

元 组 作为 与 列表 相似 的 数据 类 型 ,重点 在 于 它 的 不 可 变性 ,这 种 不 可 变性 提供 了 一 种 
具有 完整 性 和 持久 性 的 数据 结构 。 因 此 ,可 以 为 需要 固定 数据 的 地 方 提供 不 可 变 对 象 。 比 
如 后 面 会 讲 到 字典 类 型 的 键 就 是 不 可 变 的 ,这 时 就 只 能 用 元 组 而 不 能 用 列表 。 


> 于 《〈( 英雄 无 敌 》 需求 落地 


现在 我 们 研究 一 下 游戏 (英雄 无 敌 ) 的 需求 适合 用 什么 方式 来 “ 国 
实现 






(1) 开局 玩家 角色 起 名 字 ， input。 

(2) 列表 初始化 英雄 属性 : [名 字 , 血 值 ,攻击 力 ,防御 力 ]。 
(3) 判断 名 字 是 否 为 空 , 默 认为 “玩家 一 ": 放 语句 。 

(4) 判断 英雄 行动 方向 : if。 《英雄 无 敌 ) 先 代 开发 、 
(5) 设计 地 图 九 定格: 列表 或 元 组 。 ee 
(6) 优化 数据 结构 。 


他 











第 5 章 列表 和 元 组 





将 字符 串 的 《英雄 无 敌 ) 做 一 下 升级 大 致 变 成 : 


Heroes beta-0.2 

milo str worldMap if while 

i 

Welcome = '- * -welcome to Heroes world!- *-" 

mapmsg 三 '#######， 

mapins ="\n- *- the world is like this - *- \n %s \nthe '*' is you"% (mapmsg,) 
worldMap = ["#''## "二 ] 

instruction= "'"" 

contr1l your hero:| 'a'for left | 'd' for right |''"' 


print (welcome) 


name = input ('input your name:') 
hp = 100 


if not name: 
name = 'player01' 


usermsg = {'name' :name, 'hp' :hp} 


print ("HI!", usermsg['name'],'You Hp is :',usermsg['hp']) 
print (mapins,instruction) 


point =0 

while 1: 
worldMap [point] = "x*" 
print('you are here',"".join (worldMap)) 
userinput = input ('go or quit:') 


if userinput == 'd' and point < 6: 
worldMap [point] = '#" 
point +=1 
elif userinput == 'a' and point > 0: 
worldMap [point] = '#" 
point -=1 
elif userinput == 'quit': 
Print ("goodbey!!") 
break 
else: 
print (instruction) 


当然 ,这 只 是 一 个 思路 ,你 设计 的 游戏 是 什么 样子 呢 ? 自 己 实现 吧 ! 肯定 比 我 这 个 有 
意思 。 


| 加 重点 提示 
在 这 一 章 中 ,你 要 掌握 的 内 容 : 


A 














(1) 熟练 掌握 列表 和 元 组 的 各 种 操作 。 
(2) 会 用 列表 推导 式 和 生成 器 表达 式 。 
(3) 理解 深 拷 贝 和 浅 拷贝 。 


号 动 动手 


(1) 由 用 户 输入 一 系列 值 ,输入 q 则 结束 ,将 所 有 的 值 保存 为 一 个 列表 。 

(2) 编写 程序 ,实现 对 列表 的 倒序 ,如 源 列 表 为 [1,2,3,4,5], 倒 序 后 为 L[5,4,3,2,1]。 

(3) 编写 一 个 篮球 记分 系统 ,操作 者 输入 球 队 名 字 和 获得 分 数 ,由 程序 进行 累加 并 显示 
到 屏幕 上 ,然后 等 待 下 次 输入 球 队 得 分 , 当 输入 game over 时 ,屏幕 显示 比赛 结束 ,并 自动 判 
断 胜 利 一 方 , 显 示 Wineris XXX。 
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分 治 策略 一 一 函数 与 模块 


分 治 策略 基于 “分 而 治之 ”的 思想 ,在 开发 一 个 较 大 的 程序 时 ,最 好 的 办 法 是 基于 较 小 
程序 组 件 来 构建 。 较 小 的 程序 组 件 更 灵活 ,程序 更 易于 开发 和 维护 。Python 中 的 程序 组 件 
包括 函数 、 类 ,模块 和 包 。 本 章 先 讲 函 数 和 模块 。 同 时 ,这 一 章 也 可 以 给 (英雄 无 敌 ) 带 来 更 
多 的 可 能 ,比如 增加 随机 发 生 事 件 。 


(> 收听 加 还 数 基 础 


函数 就 是 一 段 具有 特定 功能 、 被 封装 、 可 重用 的 语句 块 ,通常 用 来 
实现 某 一 个 特定 的 功能 。 给 这 段 程序 起 一 个 名 字 , 就 可 以 在 程序 的 任 
何 地 方 通过 这 个 名 字 任 意 次 地 运行 这 个 语句 块 。 这 也 是 函数 的 两 个 重 
要 概念 , 定义 和 调用 。 

函数 的 工作 常态 就 是 接收 数据 ,在 内 部 进行 处 理 ,返回 处 理 结果 。 旦 ， 
一 个 有 意思 的 比喻 用 来 形容 这 样 的 模型 叫 黑箱 模型 ,这 是 个 比较 形象 0 
的 比喻 , 指 一 自封 装 了 特定 功能 的 程序 ,对 于 需要 这 种 功能 的 用 户 来 
说 ,并 不 需要 知道 内 部 实现 的 原理 和 过 程 ,程序 本 身 提供 了 输入 接口 ,经 过 内 部 处 理 后 对 用 
户 返回 结果 。 黑 箱 模型 在 编程 领域 非常 常见 ,包括 人 工 智能 实际 也 是 黑箱 模型 。 

函数 可 以 简化 脚本 ,在 前 面 的 学 习 中 ,已 经 接触 并 运用 了 一 些 Python 提供 的 内 建 函 
数 。 我 们 并 不 需要 了 解 函 数 内 部 怎样 实现 的 ,只 是 拿 来 一 个 名 字 就 可 以 实现 很 多 看 似 复杂 
的 功能 ,大 大 减少 了 程序 代码 的 复杂 度 。 

除了 Python 提供 的 内 建 函 数 ,还 可 以 根据 需要 编写 自己 的 函数 ,通常 用 来 完成 大 量 重 
复 或 特定 的 功能 ,这 跟 循环 不 一 样 ,循环 是 一 次 性 反复 执行 一 段 代码 ,而 函数 可 以 在 需要 时 
随时 被 多 次 调用 。 


6.11 自 定义 函数 


自 定义 函数 通过 def 关键 字 定义 。def 关键 字 后 就 是 函数 的 标识 符 也 就 是 函数 名 ,函数 
提供 的 输入 接口 就 是 函数 名 后 面 的 圆 括 号 , 圆 括号 中 是 变量 名 ,在 函数 中 称 为 参数 ,一 个 函 
数 的 参数 数量 视 函 数 功 能 决定 。 圆 括号 后 以 冒号 结尾 , 接 下 来 是 函数 的 语句 块 ,函数 语句 
块 相 对 于 def 要 缩 进 ,具体 格式 如 下 : 





def 函数 名 (参数 ) : 
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语句 块 (函数 体 ) 


我 们 先 看 一 个 无 参数 示例 ,把 之 前 的 九 九 乘法 表 放 到 函数 里 ,这 样 就 可 以 随时 打印 九 
九 乘法 表 了 ,为 控制 篇 幅 , 我 们 打印 到 5: 


#fun99.py 
def fun99(): # 定 义 函 数 
for i in range(1，6) : 
for j in range(1l,， i +1): 


Print(j, "sx v II 4#j, '\t', end="'') 
print ('\n') 
print ("It's Main") # 主 程序 的 其 他 代码 , 跟 函 数 无 关 
fun99 () # 调 用 函数 


这 个 例子 定义 了 一 个 名 字 叫 fun99 的 函数 ,括号 中 为 空 的 意思 是 不 需要 参数 ,最 终 的 功 
能 就 是 函数 体 的 代码 功能 。 调 用 函数 的 方法 是 在 需要 执行 的 地 方 通过 函数 名 加 圆 括号 就 
可 以 了 。 运 行 效果 如 下 : 


It's Main 

1*1=1 

1l1*2=2 2x*x2=4 

未 半 汉 二 六 2#*3=6 3%3=9 

lx*x4=4 2x*4=8 3x*x4=12 4x*x4=16 


lx*x5=5 2*5=10 3*5=15 4*5=20 5S5*5=25 


6.12 形 参 和 实 参 


自 定义 函数 作为 一 个 工具 可 能 会 在 不 同 的 情况 下 调用 ,而 且 可 能 需要 根据 情况 给 出 不 
同 的 结果 ,比如 打印 3X3 乘法 表 或 打印 100X100 的 乘法 表 就 需要 参数 ,参数 作为 函数 的 输 
入 ,由 调用 者 决定 传人 函数 不 同 的 值 , 经 过 函数 处 理 后 返回 对 应 的 结果 。 

定义 函数 时 ,在 函数 名 后 圆 括号 内 的 参数 叫 形 参 , 如 果 有 多 个 形 参 ,需要 通过 逗号 隔 
开 , 这 个 形 参 并 不 是 具体 的 值 , 它 相当 于 一 个 变量 名 。 

调用 函数 时 可 以 通过 参数 给 函数 传 值 ,通过 参数 赋值 的 过 程 叫 传 参 。 而 调用 函数 时 这 
个 参数 就 叫 实 参 ,通常 为 了 交流 方便 ,并 不 会 特意 说 形 参 或 实 参 ,而 直接 说 参数 。 

现在 我 们 先 改 造 一 下 乘法 表 的 函数 ,通过 参数 控制 打印 的 具体 值 : 


#fun99 1.py 
def fun99 (x) : # 设 置 一 个 形 参 
for i in range(l, x+1): # 实 参 的 值 可 以 传递 到 函数 体内 


for j in range(1l， i +1): 
Print (dp “dp "er dj Nt ende"") 
print('\n') 


print ("It's Main") 


fun99 (3) 
fun99 () 


© 


# 数 字 3 即 是 实 参 的 值 
# 调 用 函数 未 传 参 
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上 述 代码 设置 了 一 个 形 参 x, 当 调用 这 个 函数 时 就 需要 给 x 传 值 ,这 个 值 会 传递 到 函数 
内 部 ,有 参数 函数 调用 时 需要 注意 的 是 实 参 的 数量 要 与 形 参 相同 ,不 传 参 或 多 传 参 都 会 产 
生 异 常 , 运 行 效果 如 下 : 


>>> 

It's Main 

ES 

4 2*2=4 

1x3=3 2x*3=6 3x 上 3=9 
Traceback (most recent call last) : 


File 
"C:/Users/milo/Desktop/CrazyPythonZeroToHero/code/fun99 1.py", line 10, in <module> 
fun99() 
TypeError: fun99() missing 1 required positional argument: 'x' 
>>> 


关于 参数 的 类 型 我 们 会 在 第 6. 3 节 介 绍 。 
6.13 返回 值 


上 面 的 例子 中 ,我 们 通过 printO) 直 观 地 看 到 函数 的 执行 效果 ,但 在 使 用 过 的 内 建 函 数 
中 ,大 部 分 都 会 返回 一 个 结果 ,而 不 是 打印 到 屏幕 上 。 这 些 返回 的 结果 就 是 函数 的 返回 值 ， 
它 可 以 赋值 给 一 个 变量 ,或 者 作为 其 他 表达 式 的 一 部 分 。 


>>>max (1,2,3) 

3 

>>>X = max (1,2, 3) 
>>>print (x) 

< 


返回 值 是 函数 的 一 部 分 ,即使 不 设置 ,依然 也 有 返回 值 。 例 如 : 


x = fun99(3) # 等 号 后 调用 了 函数 ,此 时 就 已 经 向 屏幕 打印 结果 了 ,函数 的 返回 值 赋值 给 了 x 
print (x) # 打 印 函数 的 返回 值 


效果 如 下 : 


It's Main 

1x*x1=1 

1x2=2 2x*x2=4 

33 2 Se6 3%3u9 
None 


因为 没有 设置 返回 值 ,所 以 看 到 的 是 None。 

自 定义 返回 值 用 return 语句 。return 语句 后 面 是 一 个 表达 式 , 这 个 表达 式 可 以 很 复杂 
也 可 以 是 一 个 值 。 调 用 函数 相当 于 进入 函数 ,执行 到 return 语句 从 函数 中 返回 ,同时 表达 
式 的 值 作为 返回 值 。 

下 面 是 一 个 能 够 返回 给 定 半径 的 圆 的 面积 的 函数 : 


(ood, 
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def area(radius) : 
return 3.14 * radiusx*x x2 


每 个 函数 只 会 有 一 个 返回 值 ,如 果 有 多 个 return 语句 ,只 会 执行 第 一 个 。 但 是 我 们 可 
以 设计 一 些 分 支 来 返回 不 同 的 返回 值 , 比 如 下 面 这 个 获得 绝对 值 的 函数 : 


#absolute.py 
def absolute (x): 
if x<0: 
return = 
else: 
return x 


print (x) # 无 效 代码 


需要 注意 的 是 ,return 语句 一 旦 执行 ,函数 就 会 终止 ,其 后 的 其 他 语句 都 不 会 执行 。 

另外 ,Python 中 提供 了 一 个 内 建 函 数 abs() ,用 来 计算 绝对 值 。 这 里 要 说 的 是 程序 员 中 
的 一 个 共识 : 不 要 重复 造 轮子 。 简 单 地 说 就 是 已 经 存在 的 功能 可 以 直接 拿 来 用 ,练习 时 可 
以 尝试 写 一 些 , 工 作 中 不 要 什么 都 自己 写 , 费 时 费力 还 不 高 效 。 


> 用 变量 作用 域 


变量 作用 域 指 的 是 变量 起 作用 的 范围 ,涉及 函数 编程 就 会 有 变量 作用 域 的 问题 。 比 如 
我 们 在 函数 内 部 定义 的 变量 和 函数 外 部 定义 的 变量 ,作用 域 是 有 区 别 的 。 


6.21 局 部 变量 


局 部 变量 是 在 函数 内 定义 的 变量 ,这 种 变量 只 能 在 函数 内 部 使 用 。 局 部 变量 的 作用 域 
只 在 它 被 定义 的 语句 块 中 。 
下 面 的 例子 用 来 说 明 局 部 变量 : 


#func varl.py 

x=10 

def func(i): 
print ("x =", i) 
x=100 
y=.50 
print ("local x=", x) 
print ("local y= ", y) 


func (x) 
print ("x =", x) 
Print{"y = " Y) 


在 这 个 例子 中 , 主 程序 中 定义 了 变量 x 的 值 为 10, 定 义 函数 时 ,在 函数 中 也 定义 了 一 个 
变量 x, 值 是 100, 当然 ,这 两 个 变量 没有 任何 关系 ,另外 我 们 还 定义 了 一 个 变量 y。 当 调用 
函数 时 将 主 程序 的 x 的 值 传 给 函数 ,函数 内 打印 过 一 次 之 后 ,将 x 的 值 重 新 定义 为 100, 之 


@ 
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后 再 打印 一 次 。 当 函数 调用 完毕 后 再 打印 一 次 主 程序 中 x 的 值 。 可 以 看 到 主 程序 的 变量 
并 没有 被 函数 内 的 赋值 影响 。 而 y 的 值 只 在 函数 内 可 以 被 调用 ,在 函数 之 外 则 不 存在 。 运 
行 结果 如 下 : 


x=10 
local x=100 
local y= 50 
x=10 
Traceback (most recent call last): 
File 
"C:/Users/milo/Desktop/CrazyPythonZeroToHero/code/func varl.py", line 13, in <module> 
print ("y= ", y) 
NameError: name 'y' is not defined 


6.2.2 全 局 变量 


如 果 想 要 函数 内 的 变量 作用 于 函数 之 外 ,这 种 变量 的 作用 域 就 必须 是 全 局 的 。 能 够 作 
用 于 函数 内 外 的 变量 , 叫 作 全 局 变量 。 
全 局 变量 可 以 通过 global 语句 定义 ,改造 一 下 上 面 的 程序 ,把 x 和 y 定 义 成 全 局 变量 : 


#func var2.py 

x=10 

def func(i): 
global x, y 
print ("x 一 wy 41) 
x=100 
y=50 
print ("local x =", x) 
print ("local y= ", y) 


func (x) 
print ("x =", x) 
print ("y=", y) 


运行 结果 如 下 : 


x=10 

local x=100 
local y= 50 
x=100 

y= 50 


这 个 例子 中 , 主 程序 定义 过 的 x 在 函数 内 部 声明 了 全 局 变量 ,调用 了 函数 之 后 ,x 的 值 
也 跟着 变 了 。 主 程序 没 定义 过 的 y 在 函数 内 部 声明 为 全 局 变量 ,在 函数 调用 之 后 ,也 可 以 
在 主 程序 中 调用 了 。 


62.3 命名 空间 
Python 中 有 严格 的 变量 作用 域 的 区 分 ,主要 依据 就 是 变量 定义 的 位 置 ,也 就 是 命名 空 
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间 。Python 的 命名 空间 共有 三 个 : 局 部 .全 局 和 内 建 。 程 序 访问 变量 时 会 按 局 部 、 全 局 、 内 
建 的 顺序 搜索 命名 空间 。 

比如 我 们 在 一 个 函数 中 访问 一 个 变量 时 ,就 会 先 看 这 个 函数 中 是 否 有 这 个 变量 ,如 果 
没有 就 会 再 搜索 全 局 ,如 果 还 没有 就 会 搜索 内 建 命名 空间 。 不 同 函数 拥有 独立 的 命名 空 
间 , 即 不 同 函 数 中 名 字 相 同 的 变量 并 不 会 相互 影响 。 

了 解 了 命名 空间 ,还 有 一 个 问题 需要 注意 ,就 是 尽量 避免 同名 的 全 局 变量 、 局 部 变量 以 
及 函数 的 参数 定义 。 因 为 很 容易 相互 影响 ,而 且 代 码 也 不 易 阅读 。 


> 用 :二 让 参数 的 类 型 


在 第 6. 1 节 中 ,我 们 知道 传 参 可 能 会 遇 到 的 问题 ,有 参数 不 传 参 、 多 传 或 少 传 等 都 会 产 
生 异 常 , 这 一 节 我 们 来 看 看 怎么 解决 这 些 问 题 。 


6.3.1 默认 参数 


函数 设置 了 形 参 后 ,如 果 不 传 参 就 会 产生 异常 ,可 以 通过 给 参数 设置 默认 值 来 解决 这 
个 问题 。 参 数 设置 了 默认 值 后 ,在 调用 函数 时 如 果 不 传 参 ,就 会 使 用 默认 值 ; 如 果 有 实 参 ， 
则 将 实 参 重新 传递 给 形 参 。 设置 默认 参数 的 方法 就 是 在 定义 函数 时 ,通过 等 号 为 形 参 直接 
赋值 。 

下 面 是 一 个 小 例子 : 

#func machine.py 


def machine (money = 18, food = "套餐 ") : 
Print(" 一 份 sd 元 ss"s (money, fo0d)) 


machine () 
machine (36) 


这 个 例子 中 的 两 个 参数 都 设置 了 默认 值 ,调用 时 如 果 不 传 参 , 则 使 用 默认 值 ; 如 果实 参 
传 值 , 则 用 新 值 。 运 行 效果 如 下 : 


一 份 18 元 套餐 
一 份 36 元 套餐 


如 果 有 多 个 形 参 ,就 需要 特别 注意 ,因为 函数 调用 时 ,参数 赋值 默认 是 从 左 至 右 依次 赋 
值 的 。 所 以 ,如 果 多 个 形 参 中 有 默认 参数 ,要 从 右 至 左 设置 ,不 可 以 先 声明 默认 参数 ,在 右 
侧 再 出 现 没 有 默认 值 的 形 参 ,比如 下 面 几 种 形式 : 


def machine (money，food = "套餐 ") # 正 确 

def machine (money = 18，food) # 错 误 

def machine (money，food = "套餐 "，other) # 错 误 
6.3.2 关键 参数 


如 果 函 数 中 有 多 个 参数 ,可 以 通过 参数 名 字 作 为 关键 字 给 参数 赋值 ,这 时 可 以 不 按 顺 
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序 赋值 。 例 如 : 


#func machine x.py 
def machine (money，food = "套餐 ", other = "") : 
if not other: 
Print(" 一 份 sd 元 ss"s (money, foo0d)) 
else: 
Print (" 一 份 sd 元 $s 外 加 $s" s (money, food, other)) 
machine (money = 30, other = "可 乐 ") 


在 这 个 例子 中 ,我 们 跳 过 food 指定 了 money 和 other 的 值 , 效 果 如 下 : 
一 份 30 元 套餐 外 加 可乐 
关键 参数 的 好 处 就 是 可 以 不 按 顺序 传 值 。 

6.3.3 宛 余 参数 处 理 


传 值 少 可 以 通过 默认 值 解决 ,但 有 的 时 候 某 些 函 数 被 调用 时 ,传递 参数 的 个 数 比 形 参 
多 ,比如 这 样 调用 上 面 例子 的 函数 : 


machine (100，" 比 萨 "，" 可 乐 "，" 橙 汁 "，" 苏 打 水 ") 
就 会 看 到 这 样 的 异常 提示 : 


TypeError: machine () takes from 1 to 3 positional arguments but 5 were given 


异常 提示 说 得 很 清楚 ,这 个 函数 只 需要 1 一 3 个 值 ,但 是 给 了 5 个 。 这 种 情况 的 解决 办 
法 就 是 定义 函数 时 设置 可 变 长 的 参数 。 通 过 在 参数 前 加 ”* ” 即 可 实现 。 


#func machine list.py 
def machine (money，food = "套餐 "，* other): 
print (other) 
if not other: 
Print (" 一 份 sd 元 ss"s (money，food)) 
else: 
print (" 一 份 sd 元 ss 外 加 ss" % (money, food, other)) 
machine (100, "比萨", "可乐 "," 检 汁 ", "苏打 水 ") 


上 例 在 other 前 添加 了 “x* ”标识 符 , 因 为 传 参 顺序 的 原因 ,混合 普通 参数 和 可 变 长 度 参 
数 时 ,可 变 长 度 参 数 放 在 最 右边 。 效 果 如 下 : 


("可乐 '，' 检 汁 '，' 苏 打 水 ') 
一 份 100 元 比萨 外 加 (' 可 乐 '，' 检 汁 '，' 苏 打 水 ') 


可 以 看 到 ,有 了 可 变 长 度 参数 之 后 ,多 余 的 值 被 以 元 组 的 形式 保存 起 来 。 
另外 ,对 于 关键 字 传 值 ,需要 给 形 参 加 “x* * ”标识 符 , 例 如 : 


def func(* x*xargs): 


(Dy 
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print (args) 
func(x=1,y=2,2z=3) 
运行 效果 如 下 : 
Tn he 


这 时 ,多 余 的 参数 被 以 字典 的 形式 保存 下 来 。 

有 了 这 么 多 的 参数 处 理 形式 ,在 实际 项 目 中 就 可 以 灵活 运用 来 实现 不 同 的 功能 了 。 
6.3.4 序列 和 字典 做 实 参 

如 果 将 序列 和 字典 作为 形 参 传递 给 函数 会 怎么 样 呢 ? 先 看 一 个 小 例子 : 

li= [1, 2, 3] 

Wim 王 区 二 

def func (x) : 


print (x) 


func(1i) 
func (di) 


结果 如 下 : 


[1, 2, 3] 
让 


很 明显 ,列表 也 好 ,字典 也 好 ,都 是 作为 一 个 整体 传 给 了 函数 ,如 果 像 下 面 这 个 函数 正 
好 需要 3 个 值 ,可 以 在 调用 函数 通过 实 参 传 值 时 把 它们 分 解 开 来 ,方法 是 通过 加 “x ”: 


#func machine list dict.py 
1i= [1, 2, 3] 
Eh A 
def func(x, y, 2): 

return x*y*z 


func(*1i) 
func(* *xdi) 


需要 注意 的 是 , 拆 分 列表 用 “x* ”, 拆 分 字典 用 “x* * ”, 并 且 字 典 的 key 要 跟 函 数 的 形 参 
一 致 。 


【> 用 。 交 必 内 建 函 数 


Python 中 提供 了 大 量 的 内 建 函 数 ,在 功能 实现 之 前 可 以 先 看 看 是 否 已 经 存在 相关 函 
数 ,比如 len() .max() .abs 〇 等 ,手册 有 详细 说 明 ( 见 图 6-1) 。 
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Builtin Functions 

absO dict0 helpO ninO setattrO 
all0 dir0 hexO nextO sliceO 
anyO vnodO id0 objectO sortedO 
ascii 0 enumerateO inputO octO staticnethodO 
bin0 evalO intO openO str0 
bool0 execO isinstanceO ord0 sO 
bytearrayO filterO issubclassO porO superO 
bytesO floatO iterO printO tuple0 
callableO fornatO lenO propertyO typeO 
chrO frozensetO listO rangeO vars() 
classmethodO getattrO localsO reprO zipO 
conpileO globalsO napO reversedO inport__ 0 
complexO hasattrO naxO roundO 
delattrO hashO nenoryvievO set0 

图 6-1 Python 3 内 建 函数 


下 面 我 们 了 解 几 个 有 意思 的 内 建 函 数 。 


1. filter 


filter(function,iterable) : 筛选 过 滤 , 循 环 可 迭代 的 对 象 ,把 迭代 


的 对 象 当 作 函数 的 参数 ,如 果 符合 条 件 , 返 回 True; 和 否则 ,返回 False。 
例如 ,过 滤 掉 一 个 列表 中 的 所 有 偶数 


#func filter.py 
li= [1, 2, 3, 5, 7, 8, 11, 18] 
def func (x): 
if x%2 != 0: 
return True 


ret = filter (func, 1i) 


for i in ret: 
print (i) 


运行 效果 如 下 : 


~ w PP 
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filter() 函数 有 个 特别 的 地 方 就 是 第 一 个 参数 必须 是 一 个 函数 , 刚 开始 接触 会 有 


应 ,具体 应 用 时 只 要 把 手册 说 明 看 明白 , 按 手册 的 要 求 用 就 可 以 了 。 


2. map 





不 要 自己 造 轮子 


些 不 适 


map(function ,iterable,…) : 将 序列 中 的 每 一 个 元 素 都 传 到 函数 中 执行 并 返回 ,可 以 同 
时 遍历 多 个 序列 ,如 果 长 短 不 一 ,以 短 序列 为 准 。 


(全 
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例如 ,将 两 个 序列 的 元 素 分 别 相 加 


#func map.py 

| 

2 Sr 

def func (x, y): 
returnx+y 

for i in (map (func, 11, 12)): 
print (i) 


map() 也 用 到 了 函数 参数 ,结果 如 下 : 
6 


bh 


因为 取 短 的 原因 ,所 以 ,虽然 第 二 个 序列 有 4 个 值 ,但 结果 只 有 3 个 。 
【> 四 :和 类 医 名 函数 : lambda 表达 式 


lmabda 表达 式 的 作用 是 实现 一 个 轻便 的 函数 功能 ,又 不 需要 起 名 
字 , 所 以 也 叫 匿名 函数 。 

什么 时 候 会 用 到 函数 却 不 需要 名 字 呢 ?如 果 观 察 6.4 节 的 两 个 例 
子 就 会 发 现 ,其 中 的 函数 参数 都 是 为 filter() 和 map 中 定制 的 ,也 只 有 在 





filter() 和 map() 中 才 有 用 ,这 种 函数 就 可 以 用 lambda 表达 式 来 代替 。 回归 39 六 
匿名 函数 lambda 


lambda 表达 式 的 语法 为 

lambda 参数 : 返回 值 表达 式 

前 面 用 于 filter() 的 函数 可 以 写成 : 
lambda x:x%2 != 0 


这 只 是 一 个 表达 式 ,并 不 能 被 调用 ,因为 没有 名 字 。 如 果 想 调用 ,可 以 起 个 名 字 , 不 过 ， 
这 样 做 的 意义 不 大 ,也 违背 了 lambda 表达 式 的 初衷 。 例 如 : 


func = lambda x:x%2 != 0 
func(1i) 


6.4 节 filter() 的 例子 就 可 以 写成 : 


>>>filter(lambda x: x%2 != 0,1i) 


6.4 节 map() 的 例子 可 更 改 如 下 : 


>>>map (lambda xry:X+YyYyr 11, 12) 
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有 了 匿名 函数 就 可 以 使 程序 更 简洁 ,但 并 不 是 不 分 情况 地 乱用 ,比如 这 两 个 例子 还 有 
一 个 特点 ,都 是 通过 对 序列 遍历 生成 新 的 序列 或 迭代 对 象 ,这 个 特点 正 是 列表 解析 和 生成 
器 表达 式 可 以 做 的 事 。 所 以 ,这 两 个 例子 还 可 以 写成 列表 解析 的 形式 。 

用 列表 解析 改写 filter() 的 例子 如 下 : 


STL ll 2 3 Sy Tr By INL9 
>>> [1 for 1 in 1i if 1%2 = 0] 
[1, 3, 5, 7, 11] 


用 列表 解析 改写 map() 的 例子 如 下 : 


>>>11 = [1, 2, 3] 

>>>12 = [5, 7, 8, 11] 

>>> [x +y for x,y in zip(11, 12)] 
[6, 9, 11] 


这 里 用 了 一 个 函数 zip(), 它 有 什么 用 ? 请 你 查 手 册 自 学 一 下 吧 。 

虽然 这 几 个 例子 可 以 互相 转化 ,但 只 是 因为 这 几 个 方法 正好 都 可 以 用 来 解决 问题 而 
已 ,并 不 是 lambda 跟 列 表 解 析 存在 必然 联系 。 在 实际 设计 程序 时 ,根据 上 下 文 ,选择 合 适 
的 方法 即 可 。 


CE rs yield 语 名 


函数 可 以 通过 return 返回 一 个 值 , 但 是 通过 yield 语句 却 可 以 让 回 ， 
函数 分 多 次 返回 多 个 值 。 4 

简单 地 说 ,生成 器 就 是 包含 yield 关键 字 的 函数 。 本 质 上 来 说 , 关 R 
键 字 yield 是 一 个 语法 糖 , 内 部 实现 支持 了 迭代 器 协议 。 同 时 ,yield 内 
部 是 一 个 状态 机 ,维护 着 挂 起 和 继续 的 状态 。 

小 知识 ， 生成 器 yield 

语法 糖 (syntactic sugar): 指 计 算 机 语言 中 添加 的 某 种 语法 ,这 种 语法 对 语言 的 功能 并 
没有 影响 ,但 是 更 方便 程序 员 使 用 。 通 常 使 用 语法 糖 能 够 增加 程序 的 可 读 性 ,从 而 减少 程 
序 代码 出 错 的 机 会 。 不 过 它 并 没有 给 语言 添加 任何 新 东西 。 

那么 ,生成 器 是 怎么 调用 执行 的 呢 ? 只 需要 了 解 下 面 几 条 规则 即 可 。 

(1) 当 生成 器 被 调用 时 ,函数 体 的 代码 不 会 被 执行 ,而 是 返回 一 个 迭代 器 , 即 生成 器 函 
数 返回 的 是 生成 器 的 迭代 器 “生成 器 的 迭代 器 ?这 个 术语 通常 被 称 作 “生成 器 ?”。 要 注意 
的 是 生成 器 就 是 一 类 特殊 的 迭代 器 。 作 为 一 个 迭代 器 ,生成 器 必须 要 定义 一 些 方法 ,其 中 
一 个 就 是 next() 。 如 同和 迭代 器 一 样 ,我 们 可 以 使 用 next() 函数 来 获取 下 一 个 值 。 这 一 切 都 
是 在 yield 内 部 实现 的 。 

(2) 当 next() 方 法 第 一 次 被 调用 时 ,生成 器 函数 才 开始 执行 ,执行 到 yield 语句 处 停止 。 
next() 方 法 的 返回 值 就 是 yield 语句 处 的 参数 (yielded value) 。 当 继续 调用 next() 方 法 时 ， 
函数 将 在 上 一 次 停止 的 yield 语句 处 继续 执行 ,并 到 下 一 个 yield 处 停止 ;如 果 后 面 没有 
yield 就 抛 出 StopIteration 异常 。 

(3) 每 调用 一 次 生成 器 的 next() 方 法 ,就 会 执行 生成 器 中 的 代码 ,直到 遇 到 一 个 yield 
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或 者 return 语句 。yield 语句 意味 着 应 该 生成 一 个 值 ( 在 上 面 已 经 解释 清楚 ) 。return 意味 
着 生成 器 要 停止 执行 ,不 再 产生 任何 东西 。 

(4) 生成 器 的 编写 方法 和 函数 定义 类 似 , 只 是 在 return 的 地 方 改 为 yield。 生 成 器 中 可 
以 有 多 个 yield。 当 生成 器 遇 到 一 个 yield 时 ,会 暂停 运行 生成 器 ,返回 yield 后 面 的 值 。 当 
再 次 调用 生成 器 时 ,会 从 刚才 暂停 的 地 方 继续 运行 ,直到 下 一 个 yield。 生 成 器 自身 又 构成 
一 个 循环 器 ,每 次 循环 使 用 一 个 yield 返回 的 值 。 

一 个 比较 直接 的 例子 如 下 : 


#func yield.py 
def f(): 
print ("one") 
yield1 
print ("two") 
yield2 
print ("three") 


= El 

gy = next (g) 
print (gy) 
gy = next (g) 
print (gy) 
gy = next (g) 
print (gy) 


运行 结果 如 下 : 


three 
Traceback (most recent call last): 
File 
"C:/Users/milo/Desktop/CrazyPythonZeroToHero/code/func yield.py", line 15, in <module> 
gy = next (g) 
StopIteration 


从 结果 可 以 直观 地 看 到 效果 ,含有 yield 语句 的 函数 被 调用 后 就 会 返回 一 个 生成 器 对 
象 ,前 两 次 通过 next() 函数 都 可 以 取 到 yield 返回 的 值 ,第 三 次 next() 函 数 在 执行 完 函数 体 
代码 后 因为 没有 yield 了 ,所 以 抛 出 了 StopIteration 异常 。 


[> 夏 光 大 模块 和 包 
通过 函数 我 们 可 以 把 大 问题 分 解 为 若干 小 问题 ,并 且 可 以 让 程序 更 灵活 ,不 过 有 时 在 


一 个 项 目 中 的 一 些 函 数 或 类 在 几 个 程序 中 都 会 用 到 ,这 时 就 要 通过 模块 或 者 包 来 达到 代码 
重用 的 目的 。 
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6.71 模块 


Python 模块 (module) 其 实 是 一 个 Python 文件 ,以 .py 结尾 , 包 
含 了 Python 对 象 定义 和 Python 语句 。 换 名 话说, 其实 每 个 Python 
脚本 都 可 以 被 当 作 模块 。 

模块 化 编程 的 好 处 是 能 让 你 有 逻辑 地 组 织 Python 代码 有 段 ,并 且 把 
相关 代码 分 配 到 一 个 模块 里 ,能 让 代码 更 好 用 、 更 易 懂 。 在 模块 中 能 定 
义 函 数 、 类 和 变量 ,模块 里 也 能 包含 可 执行 的 代码 。 

下 面 的 脚本 就 可 以 被 当 作 一 个 模块 : 





#support.py 
def myAdd (x) : 
return x + 100 


6.72 导入 模块 
导入 模块 的 方式 是 通过 import 语句 或 from.…import 语句 ,在 一 个 程序 中 每 个 模块 只 
需要 导入 一 次 。import 语句 的 语法 为 


import modulel [, module2[, ...moduleN] 


要 调用 模块 中 的 方法 ,在 模块 导入 后 ,需要 用 “模块 名 . 函数 名 ”的 方式 。 
在 之 前 的 演示 中 已 经 用 过 import 语句 很 多 次 ,现在 要 导入 自己 写 的 模块 。 可 以 这 样 导 
入 前 面 的 support. py 模块 ,并 使 用 里 面 的 方法 : 


#test.py 
import support 
support .myAdd (5) 


第 一 次 导入 自己 写 的 模块 时 需要 注意 , 当 解 释 器 遇 到 import 语句 ,如 果 模 块 在 当前 的 
搜索 路 径 ,会 被 导 人 ;和 否则 ,会 失败 。 搜 索 路 径 是 指 一 个 解释 器 会 先进 行 搜索 的 所 有 目录 的 
列表 。 如 果 你 还 不 清楚 搜索 路 径 , 可 以 将 support. py 和 test. py 放 到 同一 个 目录 下 。 

如 果 一 个 模块 中 有 很 多 函数 ,但 是 只 需要 用 到 一 个 或 者 几 个 ,就 需要 用 from 语句 了 ， 
语法 如 下 : 


from modname import namel[,name2[,... nameN]] 
比如 ,导入 support 模块 的 myAdd 函数 ,并 调用 : 


from support import myAdd 
myAdd (5) 


通过 这 种 方式 导入 的 函数 可 以 直接 调用 ,可 以 通过 下 面 的 语句 导入 所 有 函数 : 


from support import * 


4 人 
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虽然 这 样 导 入 后 ,在 调用 函数 时 会 方便 些 , 但 并 不 建议 ,因为 很 有 可 能 跟 当前 程序 中 的 
函数 弄 混 。 

最 后 一 个 小 技巧 就 是 如 果 导 入 的 模块 名 字 比 较 长 ,可 以 通过 取 别 名 的 方式 简化 。 名 字 
可 以 自己 随便 起 ,一 些 比较 常用 的 模块 都 有 公认 的 别名 ,比如 numpy 通常 起 名 叫 np, 这 样 
其 他 人 在 看 代码 时 也 第 一 时 间 就 能 反应 过 来 你 程序 中 的 别名 代表 什么 。 


>>>import numpy as np 


6.7.3 ”搜索 路 径 


Python 在 导 和 人 模块 时 ,会 按 顺序 自动 搜索 模块 ,搜索 过 程 如 下 。 

(1) 当前 目录 。 

(2) 当前 目录 没有 , 则 搜索 shell 变量 PYTHONPATH 下 的 所 有 目录 。 

(3) 如 果 都 找 不 到 ,Python 会 查看 默认 路 径 。UNIX/Linux 下 ,默认 路 径 一 般 为 /usr/ 
local/lib/python/ ;Windows 通常 在 C:\python27\lib( 取 决 于 你 的 安装 路 径 ) 。 


6.74 包 


模块 通常 是 包含 了 很 多 函数 或 类 的 一 个 脚本 ,而 包 则 可 以 理解 为 
是 包含 了 很 多 模块 的 一 个 目录 (文件 夹 ) 。 

包 是 一 个 分 层次 的 文件 目录 结构 , 它 定 义 了 一 个 由 模块 及 子 包 和 
子 包 下 的 子 包 等 组 成 的 Python 的 应 用 环境 。 

包 就 是 一 个 文件 夹 ,但 该 文件 夹 下 必须 存在 __init__. py 文件 , 用 
于 标识 当前 文件 夹 是 一 个 包 , 该 文件 的 内 容 可 以 为 空 。 你 可 能 会 发 现 ， 
没有 __int__. py, 包 一 样 可 以 用 ,但 是 当 其 他 人 看 你 的 代码 结构 时 ,如 果 没 有 __int__. py, 其 
他 人 是 不 太 可 能 第 一 时 间 就 知道 这 目录 是 个 包 。 

现在 我 们 把 前 面 的 support. py 放 到 文件 夹 milo 里 ,并 在 这 个 milo 文件 夹 里 建 一 个 空 
文件 __init__. py。 这 时 的 milo 就 是 一 个 包 了 。 

test, py 是 用 来 测试 包 的 脚本 。 

导入 模块 跟 导入 包 类 似 ,只 是 结构 上 多 了 一 级 ,在 导入 时 注意 包 的 结构 就 可 以 了 ,比如 
下 面 这 些 方法 都 是 可 以 的 : 





模块 化 开发 : 包 


#test.py 
import milo.support 
milo.support .myAdd (5) 


#test.py 
from milo import support 
support .myAdd (5) 


#test.py 


from milo.support import myAdd 
myAdd (5) 


118 








第 6 章 分 治 策 略 一 一 函 教 与 模块 








6.75 __name__ 属 性 


Python 内 置 的 __name__ 属 性 可 以 用 来 识别 程序 是 被 导入 的 还 是 直接 执行 的 。 因 为 文 


件 如 果 是 以 顶层 程序 文件 ( 主 程序 ) 执 行 的 ， _name__ 值 为 __main_ _, 如 果 文 件 是 被 导入 


的 ， 


要 _ 


_name__ 的 值 就 是 当前 脚本 的 名 字 。 
如 果 编 写 的 模块 中 有 需要 执行 的 程序 ,而 这 些 程序 我 们 并 不 想 让 调用 者 执行 , 那 就 需 


_name_ _ 了 。 原 理 很 简单 , 先 看 下 __name_ 在 两 种 情况 下 的 值 。 


#support .py 
def myAdd (x) : 
return x + 100 


print(_ name ) 


#test.py 
import supprt 


分 别 运行 support. py 和 test. py, 运 行 结果 如 下 : 


>>>_ _main_ 


>>> support .py 


可 以 看 到 ,在 模块 中 ,我 们 打印 了 __name_ _ 的 值 ,直接 运行 的 结果 是 __main__, 但 是 在 


test, py 中 ,我 们 只 是 导 和 人 了 模块 ,也 打印 了 一 个 字符 串 ,就 是 模块 文件 的 名 字 。 这 是 因为 ， 
我 们 在 导入 模块 时 ,实际 上 就 是 加 载 了 一 次 模块 当中 的 代码 ,所 以 ,模块 中 的 print() 函数 被 
执行 ,但 此 时 的 __name__ 值 就 变 成 了 模块 文件 的 名 字 。 根 据 这 个 功能 ,可 以 避免 模块 中 的 
执行 语句 被 导入 执行 了 : 


#support .py 
def myAdd (x) : 
return x + 100 


4f°”— name em main 
print ("作为 主 程序 运行 ") 
else: #else 不 是 必需 的 


print (" 导 人 %s 模 块 "%$( name _,)) 


这 __name_ 一 一 _main__': 的 用 法 是 非常 常用 的 ,特别 是 脚本 中 有 可 被 调用 的 函数 


或 类 时 ,即便 没 人 调用 ,通常 习惯 上 也 会 这 样 执行 主 程序 。 
| 呈 重点 提示 


在 这 一 章 中 ,你 要 掌握 的 内 容 : 
(1) 会 使 用 自 定义 函数 解决 问题 。 
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(2) 明确 变量 作用 域 。 

(3) 明确 参数 和 返回 值 的 意义 和 用 法 。 
(4) 会 使 用 lambda 表达 式 和 yield 语句 。 
(5) 明确 饱和 模块 的 意义 以 及 调用 方法 。 


是 动 动手 


(1) 编写 一 个 函数 ,判断 用 户 输入 的 三 个 数字 是 否 构成 一 个 三 角形 。 

(2) 编写 一 个 函数 ,接收 传 入 的 字符 串 ,分 别 统计 大 写字 母 、 小 写字 母 、 数 字 以 及 其 他 字 
符 的 个 数 , 以 元 组 的 方式 返回 这 些 数字 。 

(3) 通过 help() 或 手册 学 习 内 建 函 数 random() 的 作用 ,并 且 尝 试 写 一 个 生成 验证 码 的 
函数 ,比如 每 次 从 自 定义 字符 集中 随机 产生 一 个 4 位 的 验证 码 。 

(4) 函数 有 一 个 特征 ,就 是 返回 值 ,这 个 返回 值 甚至 可 以 返回 一 个 函数 ,希望 你 在 书本 
之 外 可 以 多 了 解 一 下 装饰 器 和 闭 包 这 两 个 概念 ,这 对 基础 概念 的 理解 帮助 不 大 ,但 有 时 可 
以 提高 编程 效率 ,我 准备 了 视频 ,去 看 看 吧 。 





(5) 做 运 维 工作 经 常会 分 析 各 种 各 样 的 日 志文 件 ,Apache 是 一 个 非常 著名 的 Web 服 
务 器 , 它 的 日 志文 件 特点 是 每 行 记录 以 空格 来 分 割 不 同 的 记录 ,如 果 你 在 工作 中 有 接触 , 尝 
试 以 空格 为 分 割 符 来 解析 Apache 日 志文 件 , 这 里 有 一 个 视频 ,你 可 以 了 解 一 下 。 

(6) 重新 设计 《英雄 无 敌 ) 游 戏 ,通过 函数 实现 角色 在 行进 过 程 中 躁 到 陷阱 、 加 血 等 事 
件 ,并 对 角色 的 血 量 有 增加 或 减少 的 影响 ,如 果 没 有 头绪 ,看 看 视频 参考 吧 。 





解析 Apache 日 志 : 《英雄 无 敌 ): 路 途 
空格 分 割 坎坷 及 随机 事件 





为 了 涵盖 现实 世界 的 各 种 信息 ,我 们 已 经 学 习 了 数字 字符 串 、 列 表 和 元 组 这 些 数据 类 


型 。 特 别 是 掌握 了 列表 类 型 后 ,我 们 可 以 对 数据 做 很 灵活 的 操作 ,就 好 像 在 程序 运行 过 程 
中 有 个 数据 库 一样 。 字 典 和 集合 也 是 Python 中 提供 的 数据 类 型 ,字典 的 功能 更 是 非常 强 
大 ,除了 作为 一 种 数据 结构 甚至 还 可 以 变通 为 一 种 语法 结构 ,这 也 使 字典 在 解决 很 多 问题 
时 都 非常 有 用 。 


[> 让 局 是 字典 


序 集合 。 字 典 中 的 每 个 元 素 由 两 部 分 组 成 : 键 (key) 和 值 (value) ,每 个 
键 都 映射 到 一 个 值 上 。 序 列 的 索引 是 0 起 始 的 数字 ,字典 的 索引 就 是 
键 ,通过 键 访问 值 。 


字典 是 类 似 于 列表 的 一 种 数据 结构 ,不 同 的 是 ,字典 是 键 值 对 的 无 





国术 内 让 


字典 强大 的 地 方 在 于 ,字典 的 键 可 以 是 任何 不 可 变 对 象 ,比如 数 E 
字典 :创建 和 基本 操作 


字 、 字 符 串 、 元 组 等 , 值 可 以 是 任意 类 型 ,比如 数字 、 字 符 串 ,甚至 一 个 
函数 。 
741 创建 字典 


定义 字典 的 方式 是 通过 花 括号 {} 将 所 有 元 素 括 起 来 ,其 中 的 元 素 用 冒号 分 隔 键 和 值 ， 


像 下 面 这 样 ,创建 一 个 hero 对 象 : 


>>>hero = {'id':1, 'name':'milo', 'hp':100} 
>>>hero 

{"'id': 1, 'name': "milo', 'hp': 100} 
>>>type (hero) 

<class 'dict'> 


需要 注意 的 是 ,不 要 用 dict 做 变量 名 ,因为 dict 是 内 建 函 数 的 名 字 , 我 们 可 以 通过 dict() 


创建 一 个 字典 ,比如 : 


>>>dd = dict () 
>>>dd 
{} 
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这 样 就 有 了 一 个 空 字典 ,但 通常 我 们 都 会 直接 用 花 括号 创建 一 个 字典 。 
还 有 一 种 方法 就 是 通过 zip() 创 建 一 个 字典 ,zip() 可 以 从 两 个 序列 中 创建 成 对 的 元 素 ， 
再 通过 dict() 函数 就 可 以 得 到 一 个 字典 。 


>>>keys = ['id', 'name', 'hp'] 
>>>values = [1, 'milo', 100] 
>>>dict (zip (keys, values)) 

{"id"'s 1; "name’s: mdilo hp 100} 


712 ”字典 的 键 和 值 


序列 中 我 们 通过 0 起 始 的 索引 访问 元 素 ,而 字典 是 无 序 集合 ,所 以 不 存在 顺序 索引 。 在 
字典 中 的 索引 就 是 键 ,只 能 通过 键 访问 值 ,也 不 能 反 过 来 ,这 一 点 就 好 像 你 查 字 典 可 以 根据 
一 个 字 找 到 它 的 解释 ,但 不 能 反 过 来 通过 解释 找到 字 。 所 以 需要 格外 注意 键 和 值 的 设置 。 

字典 的 元 素 同 列表 一 样 是 可 变 的 ,我 们 可 以 对 键 赋值 ,除了 直接 赋值 ,字典 也 提供 了 丰 
富 的 方法 ,在 后 面 会 介绍 。 

字典 类 型 有 两 个 优势 : 一 个 是 索引 速度 更 快 ; 另 一 个 是 字典 的 值 可 以 是 任何 对 象 , 更 主 
要 的 是 你 可 以 给 每 个 值 都 起 个 名 字 。 


>>>demo = {'d':{'hp':100, 2:2.2}, 
3:[100, 200, 300], 
(1,2,3):6} 

>>> demo [3] 

[100, 200, 300] 

>>>demo[ (1,2,3)] 

6 

>>>demo['d'] 

Dhp.: 1007 2 2 

>>>demo['d'] [2] 

2 

>>>demo[3] = '333"' 

>>>demo['d'] ['hp'] = 90 

>>> demo 

was {hp 0 2 2200 30"333" (1 27 3)56) 


这 个 字典 中 包含 了 几 种 不 同 的 键 和 值 ,定义 字典 时 ,如 果 元 素 比较 多 ,可 以 分 多 行 定 
义 , 这 样 阅读 起 来 比较 方便 。 取 值 的 时 候 要 注意 键 的 类 型 以 及 所 对 应 的 值 的 类 型 ,比如 ["d] 
就 又 生成 了 一 个 字典 ,所 以 ,可 以 再 通过 新 字典 的 键 进行 操作 。 


713 字典 的 相关 操作 


之 前 介绍 了 很 多 针对 数据 集合 的 操作 ,对 字典 同样 适用 。 需 要 注意 的 是 ,字典 是 可 变 
的 ,并 且 在 字典 中 的 键 值 映射 中 , 键 起 了 关键 作用 。 

len() : 统计 字典 中 元 素 的 个 数 , 即 有 多 少 键 值 对 。 

in: 成 员 测试 ,用 来 测试 键 是 否 在 字典 中 。 


© 
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for: 遍历 字典 ,通过 迄 代 字典 的 键 实现 循环 。 
下 面 集中 演示 几 个 例子 ,注意 例子 中 所 操作 的 对 象 是 键 还 是 值 : 


>>>demo = {'milo':'123456', 'zou':'654321', 'qixian':'987654'} 
>>> demo 
Cmilor "L23456"7 "Zou": "654321"r "qixian’s "997654"} 
>>> len (demo) 
3 
>>> 'milo' in demo 
True 
>>> "123456' in demo 
False 
>>>for x in demo: 
print (x, demo [x]) 


milo 123456 
zou 654321 
qixian 987654 


7.14 字典 的 方法 


字典 类 型 中 也 提供 了 很 多 方法 ,通过 help(dict) 就 能 看 到 ,有 一 些 比较 常用 的 ,我 们 来 
i Rs 

7.1.3 小 节 我 们 遍历 字典 时 只 能 取 到 键 , 通 过 values() 方 法 就 可 以 获取 一 个 包含 所 有 
值 的 列表 ,当然 通过 keys() 获 取 的 就 是 所 有 的 键 ,你 也 可 以 通过 items() 一 次 性 获取 所 有 键 
值 对 ,items() 返 回 的 是 一 个 由 元 组 形式 返回 的 键 值 对 组 成 的 列表 。 有 了 这 几 个 方法 ,我 们 
在 遍历 字典 的 时 候 就 方便 多 了 。 


>>>demo = {'milo':'123456', 'zou':'654321', 'qixian':'987654'} 
>>> >>>demo.values () 
dict values(['123456', '654321', '987654']) 
>>>for value in demo.values () : 
Print(value) 


123456 
654321 
987654 
>>> demo. keys () 
dict keys(['milo', 'zou', 'qixian']) 
>>> demo .items () 
dict items([('milo', '123456'), ('zou', '654321'), ('qixian', '987654')]) 
>>>for key, value in demo.items () : 
print (key, '==>', 'value') 


milo ==> value 
zou ==> value 
qixian ==> value 
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[> 破 色 扫 字典 实例 : 统计 高 频 词 


通过 字典 ,可 以 做 很 多 事情 ,比如 分 析 一 首 老 歌 Killing Me Softly With His Song 中 
出 现 频率 最 高 的 单词 。 

要 实现 这 个 功能 其 实 有 很 多 方法 ,除了 使 用 字典 之 外 ,根据 前 面 学 习 过 的 知识 ,也 能 找 
出 几 种 解决 方法 。 比 如 通过 变量 列表 的 方式 等 。 如 果 使 用 字典 ,这 个 过 程 就 会 更 加 简单 明 
了 。 可 以 创建 一 个 空 字典 ,然后 遍历 数据 中 的 单词 ,以 单词 作 键 , 计 数 器 作对 应 的 值 。 每 遍 
历 一 个 单词 时 ,需要 判断 这 个 单词 是 否 已 经 在 字典 中 。 如 果 存 在 , 则 计数 器 加 1; 如 果 不 存 
在 , 则 创建 这 个 键 , 计 数 器 记 为 1。 把 这 个 核心 功能 做 成 一 个 函数 ,只 需要 把 数据 传 给 它 , 由 
它 来 返回 一 个 字典 。KMSWHS. txt 是 歌词 文件 , 跟 脚本 放 在 同一 目录 。 


#count words dict 2.py 
contents = open ('KMSWHS .txt', 'r') .read() # 读 取 全 部 歌词 
cList = contents.split() 


def histogram(contents): 
Wm 
for w in contents: 
if wind: 
d[w] +=1 
else: 
d[w] =1 
returnd 


h= histogram(cList) 
print (h) 


这 里 用 到 的 open() 作 用 是 打开 文本 文件 ,open() 对 象 的 read() 方 法 则 是 一 次 性 读 取 文 
件 内 的 所 有 数据 。 运 行 结 果 如 下 : 


{ "iliings 19r mes 227 “softly': 18r "with": 35r hig"s 34r "song®: 197 "= 1¢ 
"roberta': 1, 'flack': 1, 'strumming': 6, 'my': 20, 'pain': 6, 'fingers': 5, 'singing': 
7 "Tife"s 12y "worda"s il, telling"y 6r "whole's Or "1 87 heard': 27 he: 12% 
"ang or a A 0d dy Dad Lr (otyvler: Te and or so Lr cane le Eos 
Br "Ses: dy Mims "Tistens Lr "for le vbhiles 1r "there"s 2 "WMass 3 "this,s 
1, 'young': 1, 'boy': 1, 'stranger': 1, 'eyes': 1, 'felt': 2, 'flushed': 1, 'fever': 
1, 'embarrassed': 1，'by': 1，'the': 1, 'crowd': 1, 'found': 1, 'letters'; 1, 'read': 
Tr each es 1 "onevs 1 out ”ss 1r LOUud Tr “praved"s 17 “that™s 1 "would"s 1 
ey eb ep eo EL 2 On a 
new es lr ns Ty al Li LMAdark 1 despalir Ll then "sly "looked :1 
SEO si msn nr oreong el Onn La Sr ea 


仔细 观察 发 现 很 多 单词 只 出 现 了 一 次 ,可 以 过 滤 掉 它们 ,或 者 10 次 以 下 的 单词 都 过 滤 
掉 , 最 后 再 做 一 个 漂亮 的 输出 效果 : 
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def show(wordsDict) : 

dictList = [] 
for key, val in wordsDict.items () : 

dictList.append( (val, key)) 
dictList.sort (reverse = True) # 倒 序 排序 
print('%-10s%10s' %('word', 'count')) 
print('="#* 25) 
for val, key in dictList: 

if val > 10: 

print('%-12s $3d' $ (key, val)) 


h= histogram(cList) 
show (h) 


结果 如 图 7-1 所 示 。 





word count 
with 35 
his 34 
me 22 
my 20 
song 19 
killing 19 
softly 18 
life 12 
he 12 
words 11 
图 7-1 运行 结果 


从 结果 看 很 有 意思 ,出 现 频率 最 多 的 是 歌 名 里 的 几 个 单词 ,也 可 以 看 出 作者 要 表达 的 


重点 。 


> 攻 帮 站 字典 的 妙用 


字典 的 灵活 还 给 我 们 带 来 了 一 种 更 高 效 的 用 法 。 比 如 前 面 讲 的 计 
算 器 程序 ,需要 编写 加 \ 减 、 乘 \ 除 等 好 多 方法 ,再 通过 多 个 诗 语句 判断 
用 户 要 做 什么 ,然后 调用 相应 的 函数 ;《 英 雄 无 敌 ) 游 戏 中 判断 玩家 的 行 
进 方向 至 少 有 两 个 方向 , 标 配 应 该 是 四 个 ,如 果 都 用 让 判断 就 会 很 低 
效 ,下面 看 一 下 如 何 用 字典 解决 。 


#dict get.py 

1 

i 

c= input('operator> ') 


def myRAdd (x, y): 
returnx+y 





字典 的 妙用 : 语法 结构 
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def mySubtract (x, y): 
returnx=—Yy 
result ={ '+' : myAdd(a,p), 
'-' : mySubtract (a,b) 
} 


print (result.get(c, "just '+、- '")) 


上 述 程序 的 做 法 是 把 函数 作为 字典 元 素 的 值 , 再 通过 字典 的 get() 方 法 取 值 ,get() 会 接 
收 一 个 键 和 一 个 默认 值 ,如 果 键 在 字典 中 , 则 返回 对 应 的 值 , 否 则 返回 默认 值 。 


[> 让 让 集合 


在 Python 中 的 集合 是 一 组 对 象 的 集合 ,集合 中 的 任何 元 素 都 不 重 
复 , 元 素 没 有 顺序 ,所 以 集合 跟 字典 一 样 也 不 是 序列 。 


7.41 Python 集合 


创建 集合 的 方式 跟 其 他 数据 结构 不 同 , 没 有 符号 化 的 快捷 方式 ,只 
能 通过 set() 函 数 创建 ,set() 函 数 可 以 没有 参数 ,这 样 创建 的 就 是 一 个 
空 集 。 如 果 有 参数 , 则 只 能 有 一 个 参数 ,而 且 这 个 参数 必须 是 可 迭代 的 ,比如 字符 串 、 列 表 
等 ,生成 集合 后 是 没有 重复 元 素 的 。 





>>>nul1lSet = set () 


>>>nul1Set 

set () 

>>>xSet = set ('aabbccdd') 
>>>xSet 


{'e', ra', 'd', 'b'} 
>>>ySet = set ([1,3,5,7,3,5]) 
>>>ySet 
{Lr 3 S57 7} 
>>>print (ysSet) 
{1, 3, 5, 7} 
>>>zSet = set ([1, (2,3), 4.5]) 
>>>zSet 
{1, (2, 3), 4.5} 
>>>for i in xSet: 
print (i) 


c 
a 


qd 


>>>'a' in xSet 


True 
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>>>1len (xSet) 
4 


从 返回 值 可 以 看 出 , 空 集 显示 的 是 set() ,其 他 的 则 用 的 是 {}, 跟 字典 不 同 的 是 只 有 值 ， 
没有 键 , 所 以 不 能 通过 索引 进行 取 值 。 在 Python 2 中 所 有 的 集合 都 会 显示 set()。 

集合 的 元 素 可 以 通过 for 遍历 ,可 以 用 len() 函数 统计 长 度 ,也 可 以 用 in 判断 集合 中 是 
否 含有 某 个 元 素 ,这些 跟 其 他 集合 类 型 的 数据 相同 。 


742 ”集合 的 方法 和 应 用 


Python 集合 不 能 通过 索引 操作 ,集合 的 所 有 操作 都 是 通过 方法 ,可 以 通过 help(set) 看 
到 所 有 集合 提供 的 方法 。 

除了 集合 元 素 的 添加 、 删 除 之 外 ,交集 、 差 集 等 这 些 操 作 也 是 通过 对 应 的 方法 实现 的 。 
通常 的 操作 方法 是 一 个 集合 调用 方法 , 另 一 个 集合 作为 方法 的 参数 ,有 些 方法 需要 注意 哪 


个 做 参数 ,哪个 做 调用 者 。 
下 面 我 们 来 看 各 种 集合 的 实现 方法 ,顺便 再 复习 一 下 数学 知识 。 先 来 创建 三 个 集合 ， 
在 后 面 的 例子 中 使 用 。 


>>>XSet = set ("1234") 
>>>ySet = set ("3456") 
>>>zSet = set ("123456") 
>>>xSet 

no 

>>>ySet 

ne 5 

>>>zSet 

ne oe 


1 交集 
交集 是 两 个 集合 中 重 县 的 元 素 组 成 的 集合 ,通过 intersection() 方 法 创建 交集 。 


>>>xSet.intersection (ySet) 
{3', 14'} 


2. 并 集 
并 集 包含 两 个 集合 的 所 有 元 素 ,通过 union() 方 法 创建 。 


>>>xSet .union (ySet) 
Oe IRIX 


3. 差 集 
差 集 是 保留 不 在 另 一 个 集合 中 的 元 素 , 类 似 做 减法 ,所 以 要 注意 集合 的 调用 关系 。 通 
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过 difference() 方 法 实现 差 集 ,difference() 方 法 的 作用 是 收集 存在 于 调用 集合 但 不 存在 于 
参数 集合 的 元 素 。 


>>>xSet.difference(ySet) 
{12', 91 
>>>ySet .difference (xSet) 
ews 


4. 对 称 差 
对 称 差 是 与 交集 相反 的 集合 ,保留 两 个 集合 不 同 的 元 素 , 相当 于 并 集 减 合集 ,通过 


symmetric_difference 实现 。 


>>>xSet.symmetric difference (YSet) 
rar 


5. 判断 子 集 和 超 集 


判断 两 个 集合 的 子 集 和 超 集 关 系 会 返回 布尔 值 ,而 不 是 一 个 具体 的 集合 。 当 集合 A 的 
每 个 元 素 都 是 集合 B 中 的 元 素 , 则 A 是 B 的 子 集 (subset), 反 过 来 B 就 是 A 的 超 集 
(superset) ,通过 issubset() 和 issuperset() 来 判断 。 


>>>xSet.issubset (zSet) 
True 

>>>zSet.issubset (xSet) 
False 
>>>zSet.issuperset (xSet) 
True 

>>>xSet.issubset (xSet) 
True 

>>>xSet.issuperset (xSet) 
True 


6. 集合 元 素 的 增删 方法 


合 元 素 增删 的 方法 如 下 。 
add() : 向 集合 添加 元 素 ,如 果 元 素 已 经 存在 , 则 不 会 有 变化 。 
remove() 和 discard(): 删除 集合 中 的 元 素 ,区 别 在 于 如 果 要 删除 的 元 素 不 存在 ， 
remove() 会 报错 ,discard() 不 会 。 
clear() : 清空 集合 。 
集合 的 应 用 很 多 ,比如 去 除 重复 数据 比较 两 个 文件 的 内 容 相似 度 、 寻 找 文件 或 列表 中 
只 出 现 过 一 次 的 元 素 等 , 遇 到 跟 集 合 相关 的 问题 ,灵活 运用 即 可 。 


| 理 重点 提示 
在 这 一 章 中 ,你 要 掌握 的 内 容 : 


全 
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(1) 熟练 掌握 字典 的 定义 和 操作 。 

(2) 明确 键 和 值 的 意义 。 

(3) 理解 字典 的 值 可 以 为 任何 对 象 的 意义 。 
(4) 掌握 Python 的 集合 的 方法 和 应 用 。 


人 动 动手 


(1) 利用 字典 实现 四 则 运算 小 程序 。 

(2) 接收 键盘 输入 的 一 串 字 符 串 ,输出 每 个 字符 出 现 的 个 数 , 用 字典 编写 计数 器 程序 。 

(3) 反 向 查找 : 给 定 一 个 字典 的 键 ,可 以 找到 对 应 的 值 , 但 是 , 反 过 来 根据 值 去 找 键 却 
不 行 ,而 且 可 能 有 多 个 键 映射 到 一 个 值 上 。 现 在 ,实现 一 个 函数 ,根据 给 定 的 值 返回 对 应 的 
键 ,如 果 有 多 个 , 则 返回 一 个 列表 。 


进 阶 应 用 篇 
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文件 和 数据 持久 化 


我 们 已 经 尝试 编写 了 一 些 程序 ,但 到 目前 为 止 这些 程 序 都 是 瞬 态 的 ,因为 这 些 程序 在 运行 
的 过 程 中 会 产生 一 些 数据 ,但 随 着 程序 结束 ,数据 也 会 消失 ,再 次 运行 ,程序 又 从 头 开始 了 。 

如 果 你 已 经 写 了 自己 的 (英雄 无 敌 ) 的 程序 , 那 你 肯定 已 经 意识 到 这 个 问题 。 比 如 玩家 其 
实 并 没有 真正 的 注册 ,即便 这 一 次 游戏 运行 过 程 中 起 了 名 字 , 玩 的 过 程 中 也 有 了 经 验 的 增 
长 或 者 各 种 变化 ,一 旦 中 途 退 出 ,下 次 再 启动 游戏 还 要 从 头 开始 起 名 字 , 从 起 点 开始 游戏 。 

这 时 我 们 就 需要 数据 的 持久 化 ,比如 存储 一 部 分 关键 数据 到 永久 存储 介质 中 (如 硬 
盘 ) ,这样 再 次 运行 后 ,就 可 以 从 上 次 退出 的 地 方 继续 运行 ,相当 于 游戏 有 了 注册 和 保存 进 
度 的 功能 。 

为 了 长 期 保存 数据 ,方便 修改 和 被 其 他 程序 使 用 ,通过 文件 存 取 数据 是 一 个 比较 常见 
的 方法 。 当 然 ,在 计算 机 世界 还 有 一 个 更 强大 的 服务 于 数据 的 角色 一 一 数据 库 , 比 如 MIS 
(管理 信息 系统 ) 就 是 使 用 数据 库 。 但 是 一 般 应 用 程序 的 配置 信息 都 是 使 用 文件 来 存储 的 ， 
我 们 这 个 单机 版 的 (英雄 无 敌 ) 现 阶段 更 适合 用 文件 存储 。 

除了 简单 的 文本 ,也 可 以 将 程序 的 状态 保存 下 来 ,下 面 介绍 有 关 数 据 持久 化 的 模块 的 
内 容 。 


> 基 : 注 四 文件 读 取 


文件 分 文本 文件 和 二 进 制 文件 ,它们 都 是 由 字 节 组 成 的 信息 ,通常 
保存 在 存储 介质 上 (如 硬盘 、U 盘 ) 。 文 本 文件 都 是 可 读 的 ,比如 可 以 通 
过 文本 编辑 器 直接 打开 或 者 在 浏览 器 中 显示 。 除 了 文本 文件 之 外 的 都 
是 二 进 制 文件 ,比如 图 片 .Word 文档 ,如 果 通 过 文本 编辑 器 打开 ,会 看 
到 类 似 乱 码 一 样 的 内 容 , 不 是 可 读 字 符 。 

Python 3 中 提供 了 一 个 功能 非常 全 面 的 open() 函数 ,用 来 打开 文 
件 .进行 读 写 等 操作 。 

需要 说 明 的 是 ,你 要 适应 程序 的 运行 状态 ,说 是 打开 ,其 实 并 不 像 你 在 操作 系统 中 打开 
文件 就 能 直接 看 到 内 容 。 在 Python 中 要 访问 一 个 文件 ,首先 是 跟 文件 建立 一 个 链接 ,就 像 
是 在 程序 和 磁盘 上 的 信息 之 间 建 立 了 一 个 管道 (通道 ) ,程序 通过 管道 对 磁盘 上 的 数据 进行 
读 写 操作 。 管 道 在 Python 中 就 是 一 个 文件 对 象 ,open() 函数 用 来 创建 文件 链接 的 管道 并 
返回 代表 这 个 管道 的 文件 对 象 ,通过 这 个 对 象 的 方法 实现 后 续 操 作 。 文 件 对 象 还 有 一 些 其 
他 的 名 字 ,比如 句柄 文件 流 或 文件 描述 符 。 
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现在 我 们 先 准 备 一 个 文本 文件 ,并 且 跟 程序 放 在 同一 个 文件 夹 中 (这 点 很 重要 ,在 8. 5 
节 文 件 名 和 路 径 中 有 详细 说 明 ) 。 


#tmp.txt 
First 
Second 
Third 


文件 的 操作 基本 流程 : 打开 一 操作 一 关闭 。 

下 面 我 们 来 打开 文件 并 遍历 : 打开 用 open() 函 数 ,open() 的 参数 依次 为 : 要 打开 的 文 
件 名 ,打开 的 方式 7'( 读 ) ;文件 对 象 名 为 f; 通 过 for 进行 遍历 操作 ,对 文件 对 象 进 行 遍历 时 ， 
每 次 读 取 一 行 ;最 后 用 close() 方 法 关闭 文件 对 象 (管道 ) 。 


#fileTest r.py 

f= open("tmp.txt", 'r') 

for line in f: 
print('=>',1ine) 

f.close() 


运行 结果 如 下 : 


=> #tmp.txt 
=> First 

=> Second 
=> Third 


文件 读 取 有 3 个 方法 : read() readline() ,readlines()。 


1read () 


除了 通过 for 遍历 ,文件 对 象 自身 还 有 很 多 读 取 文 件 的 方法 ,比如 ,一 次 性 读 取 文 件 全 
部 内 容 的 read() ,以 单个 字符 串 形式 返回 文件 全 部 内 容 。 


#fileTest read.py 

f=open("tmp.txt", 'r') 

contents =f.read() 

for line in contents: 
print('=>',1ine) 

f.close() 


因为 是 一 个 大 字符 串 , 所 以 遍历 的 时 候 会 逐个 字符 的 遍历 ,其 结果 如 下 (显示 内 容 省 略 
了 NN 行 ): 

=> 非 

-> 

=>m 


Sp 
=>. 


© 
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> # 注 意 这 里 


这 时 你 会 发 现 每 一 行 结束 的 位 置 多 打 了 一 个 看 不 见 的 内 容 ,这 就 是 换行 符 , 在 不 同 的 
操作 系统 这 个 符号 会 有 些 区 别 ,比如 An(UNIX) 、N\r\n(CMS Windows) .NAr(Mac) ,可 能 会 导 
致 同样 的 代码 跨 不 同 平台 使 用 时 会 产生 不 同 的 结果 。Python 通过 'U' 修 饰 符 来 解决 跨 平台 
问题 ,比如 open (file. txt', UD. 


2. readline ( ) 
如 果 需 要 逐 行 读 取 文本 内 容 就 可 以 通过 readline() 方 法 ,每 调用 一 次 读 取 一 行 。 


#fileTest readline.py 

f=open("tmp.txt", 'r') 

linel =f.readline() 

print (linel) 

line2 = 上 .readline() 

print (line2) 

for line in f: 
print('=>',1ine) 

f.closel() 


运行 结果 如 下 : 
#tmp.txt 
First 


=> Second 
=> Third 


从 结果 可 以 看 到 ,每 次 readline() 会 读 取 一 行 , 当 执行 两 次 后 再 去 直接 遍历 文件 对 象 会 
从 readline() 结 束 的 位 置 开 始 ,这 是 因为 文件 操作 过 程 中 有 个 看 不 见 的 指针 ,后 面 会 有 
说 明 。 


3. readlines ( ) 


一 次 性 读 取 多 行 , 返 回 一 个 列表 ,每 个 元 素 是 一 行 ,这 个 的 用 法 相信 你 现在 应 该 可 以 看 
帮助 尝试 使 用 了 。 
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> 县: 文件 写 入 


以 和 异 式 打开 的 文件 相当 于 只 读 ,是 不 能 写 和 的, 如果 打开 的 文件 不 存在 ,还 会 报错 。 
要 想 向 文件 写 人 数据 则 需要 其 他 模式 的 参数 ,"w' 和 'a 都 是 可 以 写 和 人 的 模式 ,并 且 若 文件 不 存 
在 不 会 报错 ,而 是 直接 创建 一 个 。 具 体 模式 及 相应 的 作用 如 表 8-1 所 示 。 




















表 8-1 文件 模式 

模式 打开 方式 文件 存在 文件 不 存在 打开 后 指针 位 置 
和 只 读 打开 报错 文件 开始 处 

Ww’ 只 写 清空 文件 内 容 创建 并 打开 文件 开始 处 

总 只 写 打开 创建 并 打开 文件 末尾 

es 读 写 从 开始 处 打开 ,或 替换 数据 报错 文件 开始 处 
tr 读 写 清空 文件 内 容 创建 并 打开 文件 开始 处 

a 十 ' 读 写 打开 创建 并 打开 文件 末尾 

















不 同 的 打开 方式 会 产生 不 同 的 效果 ,比如 Yr 十 ' 和 'a 十 ' 都 具备 读 写 模式 ,但 是 指针 位 置 不 
同 就 导致 "十 实现 的 是 重 写 的 效果 ,a 十 实现 的 是 追加 新 内 容 的 效果 。 还 有 'w 十 ,既然 是 清 
空 文件 内 容重 新 开始 写 ,文件 是 空 的 ,“ 读 ”有 什么 意义 呢 ? 其 实 , 在 程序 对 文件 的 操作 过 程 
中 写 人 数据 后 就 可 以 读 了 ,但 是 要 注意 因为 指针 的 原因 , 写 完 就 读 是 不 会 有 数据 的 ,需要 把 
指针 向 前 移动 ,下 节 将 详细 说 明 。 

文件 对 象 写 入 的 方法 也 有 3 个 : write() .writeline() 、writelines() 。 

write() 一 次 写 人 指定 字符 串 , 如 果 和 希望 是 多 行 数据 , 则 需要 在 字符 串 中 通过 转 义 字符 
控制 所 有 格式 。 


#fileTest write.py 

s= "hello\nworld" 

f= open("wtmp.txt", 'w') 
f.write(s) 

f.close() 


文件 内 容 如 下 : 


hello 
world 


writeline() 写 人 的 内 容 会 作为 一 行 , 每 执行 一 次 增加 一 行 。writelines() 的 参数 是 一 个 
元 素 为 字符 串 的 集合 ,通常 会 用 元 组 或 列表 ,每 个 元 素 都 要 是 字符 串 。 有 具体 效果 请 动手 试 
一 下 吧 。 


© 
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> 用 :下 让 文件 内 的 指针 


在 对 文件 内 容 操 作 时 ,我 们 可 以 从 任意 位 置 开 始 读 取 和 写 入 (如 果 写 入 位 置 后 面 有 内 
容 则 会 覆盖 ), 这 需要 通过 Python 提供 的 控制 文件 读 写 起 止 位 置 的 方法 seek() ,这 个 方法 
控制 一 个 看 不 见 的 文件 指针 在 文件 内 移动 ,定位 到 要 读 写 的 位 置 , 读 取 和 写 入 包括 重 写 都 
需要 注意 指针 的 位 置 。 

fileObject. seek (offset[ ，whence]) : offset 是 开始 的 偏 移 量 ,代表 需要 移动 偏 移 的 字 节 
数 ;whence 为 可 选项 ,默认 值 为 0, 给 offset 参数 一 个 定义 ,表示 要 从 哪个 位 置 开 始 偏 移 ， 
0 代表 从 文件 开头 开始 算 起 ,1 代表 从 当前 位 置 开 始 算 起 ,2 代表 从 文件 末尾 算 起 。 下 面 在 
交互 模式 下 以 tmp. txt 为 例 看 一 下 指针 的 变化 。 


>>>f = open('tmp.txt', 'r') 
>>>f.tell() # 当 前 指针 位 置 
0 
>>>f.read() 
'#tmp.txt\nFirst\nSecond\nThird' 
>>>f£ .tell () 
30 
>>>f .seek (0) # 从 文件 头 移动 0 位 
0 
>>>f£.tell() 
0 
>>>£.seek (10, 0) # 从 文件 头 向 后 移动 10 位 
10 
>>>f£.read() 
'First\nSecond\nThird' 
>>>f.seek(-10,2) # 从 文件 尾 向 前 移动 10 位 
Traceback (most recent call last): 
File "<pyshell#166>", line 1, in <module> 
f.seek(-10,2) 
io.UnsupportedOperation: can't do nonzero end- relative seeks 


演示 中 的 tell 〇 方法 用 来 获取 指针 当前 位 置 ,通过 read() 和 seek() 移 动 指针 位 置 ,最 
后 的 f. seek( 一 10,2) 失 败 是 因为 在 文本 文件 中 ,没有 使 用 'b' 模 式 选项 打开 的 文件 ,只 人 允许 
从 文件 头 开始 计算 相对 位 置 , 从 文件 尾 计 算 时 就 会 引发 异常 。 这 里 只 要 加 上 'b' 模 式 就 可 
以 了 。 


>>> = open('tmp.txt','rb') 
>>>f.seek(- 5,2) 

25 

>>>f.read() 

b'Third' 


(sh 
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[> 县: 天 是 文件 关闭 


文件 对 象 调用 close() 方 法 意味 着 关闭 管道 ,取消 程序 和 文件 的 链接 。 关 闭 后 就 不 能 够 
再 进行 读 写 操作 了 。 

需要 注意 的 是 ,建立 管道 后 的 所 有 读 写 操作 都 是 在 内 存 上 进行 的 ,比如 文件 在 硬盘 上 ， 
我 们 打开 文件 读 取 后 ,此 时 读 取 的 数据 都 在 内 存 中 , 反 过 来 写 人 时 ,也 都 是 在 内 存 中 , 即 当 
你 执行 了 write() 后 ,此 时 打开 硬盘 上 的 相应 文件 会 发 现 ,并 没有 写 和 人 新 的 内 容 , 只 有 关闭 文 
件 对 象 后 才 会 将 内 存 中 的 数据 同步 到 磁盘 上 。 所 以 ,如 果 忘 记 关 闭 文件 可 能 会 造成 写 人 数 
据 丢 失 。 

如 果 想 在 不 关闭 文件 的 情况 下 同步 数据 ,可 以 通过 文件 对 象 的 flush() 方 法 。 


>>>f = open('tmp.txt', 'a') 
>>>f.write("hello!") 
>>>£.flush() 

>>>f.close() 


执行 过 f. flush() 就 可 以 打开 文件 看 内 容 的 变化 了 。 

文件 处 理 需 要 获取 一 个 文件 句柄 ,从 文件 中 读 取 数据 ,然后 关闭 文件 句柄 。 如 果 不 关 
闭 可 能 会 有 麻烦 。 对 于 这 种 事先 需要 设置 .事后 需要 做 清理 工作 的 场景 ,Python 的 with 语 
句 提供 了 一 种 非常 方便 的 处 理 方式 。 

如 果 不 用 with 语句 ,代码 如 下 : 


f=open("tmp.txt", 'r') 
for line in f: 

print('=>',1ine) 
f.close() 


上 述 代 码 运 行 没有 问题 ,但 相 比 with 语句 稍 显 匈 长 , with 语句 除了 有 更 优雅 的 语法 ,还 
可 以 很 好 地 处 理 上 下 文 环境 产生 的 异常 (with 语句 所 求 值 的 对 象 必须 有 一 个 __enter__() 


方法 和 一 个 __exit__() 方 法 ,类 似 方法 在 第 9 章 有 详细 讲解 )。 下 面 是 with 版 本 的 代码 ,不 
需要 手动 close: 


with open ("tmp.txt", 'r') as f: 
for line in f: 
print('=>',1ine) 


> 基文 件 名 和 路 径 


至 此 有 可 能 到 你 会 碰 到 一 些 问题 ,比如 打开 文件 失败 ,或 写 完 文件 后 找 不 到 文件 在 哪 
里 , 像 下 面 这 样 : 


@ 
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>>> 工 = open('abc.txt') 
Traceback (most recent call last) : 
File "<pyshell#172>", line 1, in <module> 
f= open('abc.txt') 
FileNotFoundError: [Errno 2] No such file or directory: 'abc.txt'" 


最 后 一 行 的 异常 说 明了 原因 , 即 文件 不 存在 。 如 果 你 碰 到 这 样 的 问题 又 不 知 所 措 , 那 
么 这 一 节 就 可 以 给 你 答疑 了 。 

操作 系统 的 重要 组 成 是 文件 和 目录 (文件 夹 )。 目 前 的 主流 操作 系统 都 是 把 文件 放 在 
目录 结构 中 ,每 个 目录 都 有 3 个 属性 : 

(1) 目录 中 文件 的 列表 。 

(2) 目录 中 目录 的 列表 。 

(3) 包含 父 目 录 ( 当 前 目的 上 一 级 目录 ) 的 链接 ,用 “. . ”表示 。 

每 个 文件 的 位 置 的 表示 方式 被 称 为 路 径 (path) ,路 径 分 相对 路 径 和 绝对 路 径 。 

(1) 相对 路 径 : 以 当前 目录 为 起 点 ,当前 路 径 可 以 用 “. ”表示 。 

(2) 绝对 路 径 : 从 文件 系统 的 顶层 目录 开始 ,比如 Linux 的 根 (/),Windows 的 C 盘 。 

所 有 的 程序 包括 交互 模式 都 有 当前 目录 ,在 前 面 的 例子 中 ,我 们 直接 给 出 文件 名 ， 
Python 就 会 在 当前 目录 去 寻找 这 个 文件 ,如 果 当 前 目录 没有 这 个 文件 ,就 会 报错 。 

Python 的 os 模块 提供 了 用 于 操作 系统 和 目录 的 一 些 相 关 函 数 ,比如 os. getcwd() 就 能 
返回 当前 目录 。 


>>>import os 

>>>o0s.getcwd() 
'C:\\CrazyPythonZeroToHero\\code\\8' 
>>>print (os.getcwd()) 
C:\CrazyPythonZeroToHero\code\8 


这 里 获得 的 是 当前 目录 的 绝对 路 径 , 可 以 看 出 这 是 Windows 的 一 个 路 径 , 之 前 的 tmp. 
txt 就 放 在 C:\\CrazyPythonZeroToHero\\code\\8 这 个 路 径 下 ,也 就 是 名 为 8 的 文件 夹 
里 。 路 径 中 的 “\” 用 来 分 隔 上 下 级 ,为 防止 转 义 字符 的 特殊 含义 ,os. getcwd() 对 返回 的 字符 
串 做 了 转 义 处 理 , 所 以 会 看 到 两 个 \”。 路 径 分 隔 符 在 Linux 和 苹果 操作 系统 中 是 “/”。 如 
果 要 通过 绝对 路 径 打 开 tmp. txt 就 需要 这 样 表示 : 


>>>open('C:\\ CrazyPythonZeroToHero\\code\\8\\tmp.txt') 


直接 提供 文件 名 的 形式 就 是 相对 路 径 的 写法 ,Python 会 假设 该 文件 位 于 当前 程序 所 运 
行 的 目录 中 。 如 果 是 上 一 级 或 下 一 级 目录 ,相对 路 径 可 以 这 样 表示 : 


path="./code/tmp.txt" # 当 前 目录 下 的 code 目录 下 的 tmp .txt 文件 
path = "../tmp.txtn # 当 前 目录 的 父 目 录 中 的 tmp.txt 文件 


上 述 例子 中 的 “. ”代表 当前 目录 ,“.. ”代表 父 目录 。 
什么 时 候 用 绝对 路 径 , 什 么 时 候 用 相对 路 径 呢 ?如 果 你 是 在 当前 目录 运行 程序 或 启动 
shell ,就 可 以 通过 相对 路 径 打开 以 当前 目录 做 参照 的 任何 文件 ;如 果 需 要 指定 确切 的 文件 


A 
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位 置 ,就 必须 提供 绝对 路 径 。 


CE 。 并 关 


os 模块 提供 了 非常 丰富 的 函数 ,这 里 我 们 先 认识 其 中 的 一 小 部 分 。 
首先 是 第 一 个 应 用 ,获取 当前 目录 下 某 文件 的 绝对 路 径 : 


>>>o0s.path.abspath('tmp.txt') 
'C:\\ CrazyPythonZeroToHero\\code\\8\\tmp.txt' 


接 下 来 ,打开 的 文件 如 果 不 存在 也 会 报错 ,所 以 可 以 先 判 断 一 下 给 定 的 文件 或 目录 是 
否 存 在 : 


>>>0Ss .path.exists('test.txt') 
False 
>>>o0s.path.exists('tmp.txt') 
True 


如 果 存 在 ,就 是 下 一 个 问题 了 。 这 一 串 字符 串 最 后 如 果 不 是 后 绥 名 ,根本 不 能 判断 是 
文件 还 是 目录 ,所 以 下 面 需要 判断 一 下 是 文件 还 是 目录 : 


>>>os.path.isdir ('tmp.txt') # 是 否 为 目录 
False 

>>>os.path.isfile('tmp .txt') # 是 否 为 文件 
True 


最 后 把 这 几 个 函数 合理 利用 一 下 ,实现 一 个 遍历 给 定 目录 ,打印 所 有 文件 的 绝对 路 径 ， 
先 创建 供 测试 的 目录 ,结构 如 图 8-1 所 示 。 
































(a) 
(b) © x.txt 
y.txt Z.txt 
图 8-1 目录 树 


下 面 代码 中 listdir( ) 的 作用 是 返回 指定 目录 中 文件 和 目录 的 名 字 组 成 的 列表 ;接收 
join() 一 个 目录 和 一 个 文件 名 字 ,并 将 它们 拼接 成 一 个 完整 的 路 径 。 


#walkdir.py 
import os 
def walk (dirName): 
for name in os.listdir (dirName): 
path = os.path.join (dirName, name) 


全 
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if os.path.isfile (path): 
print (path) 

else: 
walk (path) 


a\b\y.txt 
a\b\z.txt 
a\x.txt 


这 个 例子 中 用 到 了 函数 的 一 种 特殊 用 法 ,就 是 在 让.…else 语句 中 ,调用 了 函数 自己 ,这 
种 用 法 叫 递归 。 

我 们 从 逻辑 上 分 析 一 下 递归 的 意义 , 自 定义 函数 walk() 的 作用 是 获取 目录 下 所 有 文件 
和 目录 的 列表 ,遍历 并 获得 完整 路 径 , 判 断 是 否 为 文件 ,如 果 是 文件 , 则 直接 打印 ,如 果 不 是 
文件 , 那 就 是 目录 ,然后 呢 ? 目录 下 可 能 还 有 目录 和 文件 ,所 以 现在 要 做 的 事 就 是 再 重复 
walk() 要 做 的 事 , 所 以 直接 调用 自身 。 

递归 函数 一 定 要 有 结束 的 条 件 , 否 则 就 会 进入 到 很 深 的 递归 中 ,本 例 的 递归 结束 条 件 
就 是 没有 目录 。 

最 后 ,其 实 os 模块 自 带 了 一 个 walk() 函数 ,你 可 以 通过 帮助 或 查看 手册 搞 明 白 使 用 方 
法 , 它 要 比 这 个 自 定义 的 函数 强大 方便 得 多 , 试 着 改写 这 个 函数 吧 。 


> 下 :六 4 捕获 异常 


当 我 们 尝试 读 取 或 写 人 文件 时 很 有 可 能 会 出 现 错误 ,比如 : 


>>>open('abc.txt') 
FileNotFoundError: [Errno 2] No such file or directory: "abc.txt' 


这 时 可 以 通过 类 似 os. path. exists 和 os. path. isfile 这 样 的 函数 ,将 可 能 出 现 错误 的 因 
素 进 行 提 前 判断 。 但 要 考虑 到 所 有 因素 会 耗费 大 量 的 代码 成 本 ,这 时 我 们 可 以 尝试 执行 可 
能 出 现 问 题 的 代码 , 当 发 生 问题 时 再 解决 ,这 个 尝试 就 是 try 语句 ,语法 类 似 if: 


try: 
f= open('abc.txt') 
for line in f: 
Pass 
except: 


print ("文件 不 存在 ") 


Python 执行 到 try 语句 后 ,如 果 代 码 块 正常 执行 , 则 跳 过 except 语句 并 继续 执行 其 他 
代码 。 如 果 发 生 异 常 , 则 跳出 try 并 执行 except 语句 下 的 代码 块 。 
异常 的 类 型 我 们 在 前 面 的 练习 中 已 经 磁 到 了 一 些 ,可 以 在 你 的 程序 中 尝试 加 入 异常 
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处 理 。 


> 基数 据 序列 化 


很 多 时 候 我 们 会 有 下 面 的 需求 : 

(1) 把 内 存 中 各 种 数据 类 型 的 数据 通过 网 络 传送 给 其 他 机 器 或 客户 端 。 

(2) 把 内 存 中 各 种 数据 类 型 的 数据 保存 到 本 地 磁盘 持久 化 。 

我 们 可 以 把 字符 串 写 人 文件 中 保存 起 来 ,但 是 要 保存 其 他 对 象 呢 ? 比如 列表 、 元 组 、 字 
典 等 。Python 中 提供 了 很 多 保存 对 象 的 模块 ,可 以 根据 需要 灵活 选择 。 

将 对 象 转换 为 可 通过 网 络 传输 或 可 以 存储 到 本 地 磁盘 的 数据 格式 (如 XML、JSON 或 
特定 格式 的 字 节 串 ) 的 过 程 称 为 序列 化 ;反之 , 则 称 为 反 序 列 化 。 


8.81 pickle 模块 


pickle 模块 实现 了 用 于 对 Python 对 象 结构 进行 序列 化 和 反 序 列 
化 的 二 进 制 协议 ，pickle 模块 序列 化 和 反 序 列 化 的 过 程 分 别 叫 
pickling 和 unpickling。 

(1) pickling: 将 Python 对 象 转换 为 字 节 流 的 过 程 。 

(2) unpickling: 将 字 节 流 二 进 制 文件 或 字 节 对 象 转换 回 Python 本 
对 象 的 过 程 。 

pickle 模块 可 以 将 几乎 所 有 类 型 的 对 象 转换 为 适合 保存 的 字符 串 写 人 文件 中 ,并 且 可 
以 转换 回来 直接 变 成 对 象 。 

通过 pickle 把 数据 持久 化 到 本 地 磁盘 ,这 部 分 数据 通常 只 是 供 系统 内 部 使 用 ,因此 数 
据 转 换 协议 以 及 转换 后 的 数据 格式 也 就 不 要 求 是 标准 、 统 一 的 ,只 要 本 系统 内 部 能 够 正确 
识别 即 可 。 但 是 ,系统 内 部 的 转换 协议 通常 会 随 着 编程 语言 版 本 的 升级 而 发 生变 化 (改进 
算法 、 提 高 效率 ) ,因此 通常 会 涉及 转换 协议 与 编程 语言 的 版 本 兼容 问题 。 

现在 来 看 一 下 通过 pickle 模块 进行 序列 化 和 反 序 列 化 的 例子 。 

序列 化 常用 方法 有 下 面 两 个 。 

(1) pickle. dumps(object) : 接收 一 个 对 象 作为 参数 ,并 返回 对 象 的 字符 串 表 达 形 式 。 

(2) pickle. dump(object,f) : 用 来 将 对 象 object 写 入 二进制 文件 f 中 ,第 一 个 参数 object 是 
对 象 名 ,第 二 个 参数 {是 文件 对 象 。 写 入 的 数据 同 pickle. dumps(object) 返 回 的 字符 串 。 





>>>import pickle 

>>>f = open('testl.pickle', 'wb') 

>>>t = (1,2,3) 

>>>pickle.dumps (t) # 返 回 元 组 t 的 二 进 制 字符 串 形 式 
b'\x80\x03K\x01K\x02K\x03\x87q\x00." 

>>>pickle.dump(t, f)  # 对 象 写 人 文件 

>>>os.listdir() # 列 出 点 前 目录 的 文件 列表 ,此 时 未 同步 到 磁盘 

['a', 'fileTest r.py', 'fileTest read.py', 'fileTest readline.py', 'fileTest_ 
write.py', 'filetmp.txt', 'testl.pickle', 'tmp.txt', 'tmp bak.txt', 'walkdir.py', 
‘wtmp .txt'] 
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>>>£.flush() # 同 步 

>>>0s.1istdir () # 已 写 人 磁盘 

['a', 'fileTest r.py', "fileTest read.py', 'fileTest readline.py', 'fileTest 
Wwrite.py', 'filetmp.txt', 'testl.pickle', 'tmp.txt', 'tmp bak.txt', 'walkdir.py', 
'wtmp .txt'] 

>>>open('testl.pickle', 'rb') .read()b'\x80\x03K\x01K\x02K\x03\x87q\x00."' 

# 直 接 读 取 没 有 意义 ,内 容 和 dumps 一 样 


现在 已 经 成 功 地 将 对 象 写 人 磁盘 的 一 个 二 进 制 文件 中 了 , 想 要 使 用 这 个 文件 中 保存 的 
对 象 时 ,只 需要 通过 pickle. load(f) 方 法 从 二 进 制 文件 f 中 读 取 对 象 的 字符 串 再 还 原 成 对 
象 ,也 就 是 反 序列 化 : 


>>> import pickle 

>>>f£ = open ("testl1 .pickle", 'rb') 
>>>newT = Pickle.load (f) 
>>>print (newT) 

(1, 2, 3) 


8.82 json 模块 


如 果 要 将 一 个 系统 内 的 数据 通过 网 络 传输 给 其 他 系统 或 客户 端 ， 
通常 需要 把 这 些 数据 转化 为 字符 串 或 字 节 串 ,而且 需要 规定 一 种 统一 
的 数据 格式 才能 让 数据 接收 端正 确 解析 并 理解 这 些 数 据 的 含义 。 
XML 是 早期 被 广泛 使 用 的 数据 交换 格式 ,在 早期 的 系统 集成 论文 中 经 a 
常 可 以 看 到 它 的 身影 ;如 今 大 家 使 用 更 多 的 数据 交换 格式 是 JSON i 
(JavaScript Object Notation), 它 是 一 种 轻 量 级 的 数据 交换 格式 。 

JSON 相对 于 XML 而 言 ,更 加 简单 .易于 阅读 和 编写 ,同时 也 易于 机 器 解析 和 生成 。 除 此 之 
外 ,我 们 也 可 以 自 定 义 内 部 使 用 的 数据 交换 格式 。 

大 部 分 编程 语言 都 会 提供 处 理 JSON 数据 的 接口 ,Python 2. 6 开始 加 入 了 json 模块 ， 
且 将 它 作 为 一 个 内 置 模块 提供 ,无 须 下载 即 可 使 用 。 

Python 的 json 模块 序列 化 与 反 序列 化 的 过 程 分 别 叫 encoding 和 decoding。 

(1) encoding: 把 Python 对 象 转换 成 JSON 字符 串 。 

(2) decoding: 把 JSON 字符 串 转 换 成 Python 对 象 。 

Python 与 JSON 数据 类 型 转化 关系 如 表 8-2 所 示 。 


表 8-2 ”Python 与 JSON 数据 类 型 




















Python JSON Python JSON 
dict Object True true 
list，tuple array False false 
str string None null 
int, float, int- & float-derived Enums | numbers 








json 模块 的 常用 函数 跟 pickle 是 一 样 的 ,可 以 直接 参考 pickle 演示 的 例子 ,模块 改 成 
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import json 就 可 以 了 。 

pickle 模块 与 json 模块 对 比如 下 。 

(1) JSON 是 一 种 文本 序列 化 格式 ( 它 输出 的 是 unicode 文件 ,大 多 数 时 候 会 被 编码 为 
utf-8) ,而 pickle 是 一 个 二 进 制 序列 化 格式 。 

(2) JOSN 是 我 们 可 以 读 懂 的 数据 格式 ,而 pickle 是 二 进 制 格式 ,我 们 无 法 读 懂 。 

(3) JSON 是 与 特定 的 编程 语言 或 系统 无 关 的 , 且 它 在 Python 生态 系统 之 外 被 广泛 使 
用 ,而 pickle 使 用 的 数据 格式 是 特定 于 Python 的 。 

(4) 默认 情况 下 ,JSON 只 能 表示 Python 内 建 数据 类 型 ,对 于 自 定义 数据 类 型 需要 一 
些 额 外 的 工作 来 完成 ;pickle 可 以 直接 表示 大 量 的 Python 数据 类 型 ,包括 自 定义 数据 类 型 。 

(5) 需要 与 外 部 系统 交互 时 用 json 模块 。 

(6) 需要 将 少量 ,简单 Python 数据 持久 化 到 本 地 磁盘 文件 时 可 以 考虑 用 pickle 模块 。 

如 果 需 要 将 大 量 Python 数据 持久 化 到 本 地 磁盘 文件 或 需要 一 些 简单 的 类 似 数据 库 的 
增 、 删 、 改 、 查 功能 时 ,可 以 考虑 用 shelve 模块 。 

shelve 是 一 个 简单 的 数据 存储 方案 ,类 似 key-value 数据 库 , 可 以 很 方便 地 保存 python 
对 象 ,其 内 部 通过 pickle 协议 实现 数据 序列 化 。 我 们 可 以 把 shelf 对 象 当 dict 使 用 ,存储 、 
更 改 、 查 询 某 个 key 对 应 的 数据 。 

shelve 只 有 一 个 open() 函数 ,这 个 函数 用 于 打开 指定 的 文件 (一 个 持久 的 字典 ) ,然后 
返回 一 个 shelf 对 象 。shelf 是 一 种 持久 的 、 类 似 字 典 的 对 象 。 操 作 很 简单 ,可 以 通过 手册 自学 。 


【> 晓 : 凡 有 CSV 文件 


CSV 也 叫 喜 号 分 隔 值 (分 隔 字符 也 可 以 不 是 逗号 ) ,其 文件 以 纯 文本 形式 存储 表格 数 
据 , 后 级 名 是 * . csv。 但 CSV 并 不 是 一 种 独立 的 文件 类 型 ,而 是 一 种 文件 格式 ,CSV 实际 
上 就 是 文本 文件 ,可 以 通过 open() 操 作 。 另 外 ,用 记事 本 就 可 以 直接 编辑 ,当然 用 Excel 也 
可 以 ,因为 CSV 也 是 表格 的 变种 。CSV 文件 由 任意 数目 的 记录 组 成 ,记录 间 通 常用 逗号 分 
隔 ; 每 条 记录 由 若干 字段 组 成 。 通 常 ,所 有 记录 都 有 完全 相同 的 字段 序列 。 

CSV 是 一 种 通用 的 、 相 对 简单 的 文件 格式 ,被 用 户 、 商 业 和 科学 广 
泛 应 用 。 最 广泛 的 应 用 是 在 程序 之 间 转 移 表格 数据 。 例 如 ,一 个 用 户 
可 能 需要 交换 信息 ,从 一 个 以 私有 格式 存储 数据 的 数据 库 程序 到 一 个 
数据 格式 完全 不 同 的 电子 表格 。 最 有 可 能 的 情况 是 ,该 数据 库 程 序 可 以 
导出 数据 为 CSV ,然后 被 导出 的 CSV 文件 可 以 被 电子 表格 程序 导入 。 


8.91 CSV 模块 


首先 生成 一 个 CSV 文件 ,这 里 有 一 个 普通 的 Excel 表格 文件 testcsv. xlsx, 内容 如 图 8-2 
所 示 。 

只 需要 另存 为 csv 类 型 就 可 以 了 ,用 记事 本 打开 就 会 开 看 到 如 图 8-3 所 示 的 内 容 。 

可 以 看 到 ,CSV 文件 就 是 普通 文本 文件 ,表格 最 后 一 行 空白 的 位 置 也 由 逗号 隔 开 , 但 是 
表格 中 的 共识 是 没 办 法 实现 的 ,所 以 并 不 会 改 一 个 值 而 影响 到 其 他 值 。 看 到 这 个 文本 , 相 
信 你 已 经 可 以 对 CSV 文件 进行 操作 了 ,Python 还 提供 了 一 个 CSV 模块 ,能 够 以 相对 简单 
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;| A B C D E 

name mathematics |english |chinese |average 
anilo 100 100 100 100| 
3 |tom | 60 0 30 30| 
a jerry 80 80 80 80| 
5 average 70| 











居 test.csv -记事 本 


文件 F) 编辑 [E) 格式 (D) 查看 (V) 帮助 (H) 


name, mathematics, english, chinese, average 六 
milo, 100, 100, 100, 100 
tom, 60, 0, 30, 30 

jerry, 80, 80, 80, 80 
average, ,,, 70 


图 8-3 CSV 文 件 内 容 


的 方式 读 写 CSV 文件 。 
8.92 CSYV 读 写 





csv 模块 提供 了 csv. reader(fileobject) 读 取 文 件 , 以 及 csv. writer(fileobject) 写 CSV 文 


件 。 参 数 是 文件 对 象 ,这 意味 着 要 先 打开 文件 后 再 进行 CSV 读 写 操作 。 


csv. reader 会 遍历 文件 ,每 次 循环 返回 文件 中 的 一 行 ,并 以 字符 串 列表 的 形式 返回 , 列 


表 中 每 个 元 素 就 是 表格 列 的 值 ,例如 : 


#csvtest .py 
import csv 
fobj =open('test.csv', 'rU') # 注 意 U 
csvobj = csv.reader (fobj) 
for row in csvobj: 
print (row) 


运行 结果 如 下 : 


['name', 'mathematics', 'english', 'chinese', 'average'] 


['milo', '100°', '100°', '100', '100'] 
Letom S60 "Op T3007 0 30 
Ljderryy "30" "0" "80", "80°] 
Lemareye ie ey 


获取 数据 后 我 们 来 更 新 一 下 表格 数据 。 写 人 数据 时 ,并 不 能 像 在 表格 中 那样 , 选 一 个 ， 
然后 直接 更 改 ,而 是 要 把 原 数据 全 部 读 取出 来 ,更 改 指定 值 后 再 写 回 文件 中 ,比如 ,将 milo 
的 所 有 期 末 考 试 成 绩 变 成 70 分 ,平均 分 就 变 成 了 90 分 ,操作 如 下 : 


#csvtest.py 


A 
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import csv 

readobj = open('test.csv', 'rU') 

csvobj = csv.reader (readobj) 

allCsv= [] 

for row in csvobj : 
allCsv.append (row) 


allCsv[1] [3] = 70 


theSum = 0 

for i inallcsv[1][1:4]: 
theSum += int (i) 

x= theSum/3 

allCsv[1] [-1] = '%d' %x 


theSum = 0 

for row in allCcsv[1:-1]: 
theSum += int (row[-1]) 

y= theSum/3 

allCsv[-1][-1] =y 


with open('newtest.csv','w') as writeObj: 
writer = csv.writer (writeObj) 
for row in allCsv: 
writer.writerow (row) 


需要 注意 的 是 ,程序 运行 过 程 中 ,不 要 同 其 他 应 用 程序 打开 或 占用 CSV 文件 , 写 入 的 时 
候 要 写 人 一 个 新 的 文件 。 结 果 如 图 8-4 所 示 。 








届 newtest.csyv -记事 本 2 | x 


文件 (F) 编辑 (E) 格式 (DO) 查看 (V) 帮助 0H) 

ame, mathematics, english, chinese, average 六 
ilo, 100, 100, 70, 90 

tom, 60, 0, 30, 30 

jerry, 80, 80, 80, 80 

average, ,，, 66. 66666666666667 





图 8-4 结果 
最 后 的 平均 数 比较 长 ,请 你 改写 程序 使 小 数 点 后 保留 两 位 。 
| 畦 重点 提示 


在 这 一 章 中 ,你 要 掌握 的 内 容 : 
(1) 掌握 文件 的 读 写 操作 。 
(2) 明白 文件 内 指针 的 作用 。 
(3) 理解 路 径 的 意义 。 

(4) 会 进行 数据 持久 化 操作 。 
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人 动 动手 


(1) 编写 程序 ,可 用 来 复制 文件 ,比如 文本 文件 图片. 音频 视频。 提示 : 二 进 制 形式 
从 源 文件 读 取 , 写 入 目标 文件 。 

(2) 自 建文 本 文件 ,内 容 有 hi, 替换 文件 中 hi 为 hello。 提 示 : 每 次 读 两 个 字符 。 

(3) 编写 程序 ,由 用 户 输入 文件 名 ,在 打开 文件 时 ,如 果 不 存在 ,实现 反复 提示 ,要 求 输 
入 正确 的 文件 名 ,要 求 用 到 异常 处 理 。 

(4) 利用 CSV 实现 一 个 学 生 信息 管理 系统 ,初始 状态 为 每 个 学 生 有 三 条 记录 : 学 号 、 
姓名 、 电 话 。 程 序 须 提供 的 功能 包括 : 显示 数据 、 删 除 行 、 插 入行、 修改 单元 格 数据 。 

提示 : @ 读 取 表格 数据 后 要 以 适当 的 数据 结构 存储 ;@ 各 操作 以 字母 作为 开启 接口 ， 
比如 I 代表 要 插入 数据 。 

(5) 考虑 给 《英雄 无 敌 ) 增 加 相应 功能 : 

@ 存 进度 (保存 玩家 信息 、 角 色 状 态 等 )。 

@ 程序 启动 后 ,用 户 可 以 通过 用 户 名 和 密码 登录 游戏 。 

@ 对 用 户 名 和 密码 进行 验证 ,3 次 机 会 ,验证 失败 , 则 锁定 账号 ,由 
管理 员 解 锁 。 提 示 : 锁定 功能 可 以 用 创建 一 个 文件 的 形式 ,比如 用 户 
被 锁定 后 则 创建 一 个 文件 ,下 次 用 户 登录 时 ,程序 检测 到 这 个 文件 , 则 
代表 用 户 被 锁定 ,管理 员 手 动 删除 此 文件 即 可 解锁 ,也 可 以 写 一 个 管理 
员 解 锁 专 用 程序 。 

具体 的 实施 可 以 根据 自己 的 想法 来 实现 , 遇 到 问题 解决 问题 ,实现 不 了 的 就 换 思路 。 






| 
Par ml, 


《英雄 无 敌 ): 软 件 上 锁 


(oh, 


面向 对 象 


我 们 已 经 系统 学 习 了 用 Python 中 的 内 置 类 型 和 基本 语法 组 织 数 据 与 程序 。 比 如 可 以 
通过 列表 把 数据 收集 起 来 ,可 以 通过 函数 把 代码 封装 起 来 以 便 反复 使 用 。 

越 深入 学 习 ,我 们 就 越 希 望 可 以 提高 代码 的 重用 度 , 比 如 函数 .模块 。 但 是 , 当 我 们 需 
要 编写 一 个 较为 庞大 的 项 目 时 ,单纯 的 数据 或 者 函数 已 经 满足 不 了 实际 需求 ,这 时 就 需要 
引入 面向 对 象 这 个 新 的 编程 模式 ,或 者 称 之 为 一 种 思想 。 

在 前 面 的 学 习 中 已 经 接触 过 对 象 了 ,最 简单 的 比如 一 个 字符 串 对 象 , 它 其 实 就 是 把 数 
据 和 函数 都 收集 到 了 一 起 。 对 象 的 函数 就 是 方法 ,用 help(Cstr) 就 能 看 到 所 有 字符 串 对 象 的 
方法 ,通过 点 记 法 就 可 以 调用 ,比如 "hello". upper() 。 

在 这 一 章 我 们 要 讲 的 是 什么 是 对 象 , 如 何 创建 和 使 用 对 象 。 


从 《英雄 无 敌 》 开 始 认识 对 象 


对 于 新 手 ,面向 对 象 可 能 不 太 好 理解 ,但 是 也 没有 那么 难 ,就 跟 学 
习 如 何 定 义 字符 串 没什么 区 别 , 不 用 太 着 急 开始 ,可 以 先 重新 思考 一 下 
设计 的 《英雄 无 敌 ) 游 戏 ,不 知道 你 是 否 已 经 设计 了 一 个 很 不 错 的 文本 
模式 的 游戏 ,现在 可 能 要 全 部 重新 设计 了 。 

现在 按照 我 的 思路 来 设计 这 个 游戏 : 首先 至 少 需要 2 个 角色 ,一 Le 
个 是 英雄 ,一 个 是 怪兽 ,每 个 角色 可 能 有 各 种 不 同 的 样子 ,比如 每 个 玩 
家 的 英雄 人 物 不 同 , 且 英 雄 和 怪兽 都 有 不 同 的 技能 ,如 人 拿 刀 砍 怪 兽 ,怪兽 可 以 咬 人 ,怎么 
描述 这 两 种 不 同 的 角色 和 他 们 的 共同 功能 呢 ? 

按 我 们 已 经 掌握 的 知识 , 写 出 了 如 下 的 代码 来 描述 这 两 个 角色 : 





# 定 义 英雄 和 怪物 的 模板 
def hero (name, hp, attack): 
data =! 
'name' :name, 
'hp' :hp, 
'attack':attack 
1 
return data 


def monster (name, hp, monster type): 
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data = 1{ 
Iame':namey 
"hp' :hp, 


'type':monster type 
} 
return data 





上 面 两 个 函数 相当 于 造 了 两 个 模板 ,游戏 里 的 每 个 英雄 和 每 个 怪物 都 拥有 相同 的 属性 
(变量 )。 游 戏 开 始 后 ,根据 每 个 玩家 或 某 个 怪物 传人 的 具体 信息 来 塑造 一 个 具体 的 英雄 人 
物 或 者 怪物 ,方法 如 下 : 


hero2 =hero('mario', 100, 20) 
monsterl =monster('turtle', 200, 'turtle') 


这 样 就 相当 于 有 了 两 个 角色 对 应 的 对 象 , 接 下 来 就 是 他 们 各 自 的 方法 ,英雄 可 以 攻击 
怪兽 ,怪兽 可 以 溜达 着 咬 英 雄 , 只 须 分 别 定义 对 应 的 函数 ,需要 谁 做 什么 调用 谁 的 函数 就 可 
以 了 ,代码 如 下 : 


def kill (h): 

print ("hero $s attacking monster!" sh['name']) 
def walking (m): 

print ("monster $s : Walkingl"sm['name']) 


kill (hero2) 
walking (monsterl1) 


运行 效果 如 下 : 


hero mario attacking monster! 
monster turtle : Walking! 


看 起 来 已 经 实现 了 我 们 要 的 效果 ,有 英雄 和 怪物 对 象 ,各 自 有 各 自 的 方法 ,但 实际 上 ， 
对 于 这 两 个 方法 你 可 以 看 到 ,它们 并 不 是 谁 专属 的 ,因为 下 面 这 样 也 是 可 以 的 : 


>>>kill (monster1l) 
hero turtle attacking monster! 


可 以 看 到 ,代码 运行 正确 ,但 是 这 看 起 来 就 像 是 把 怪 曾 对象 传 给 了 英雄 的 方法 ,这 在 游 
戏 逻 辑 上 是 完全 不 允许 的 。 这 时 就 需要 人 为 在 代码 上 加 以 限制 ,代码 如 下 : 


#hero2.py 
# 定 义 英 雄 和 怪物 的 类 别 函 数 
def hero (name, hp, attack): 
def kill (h): 
print ("hero %s attacking monster!" $h['name']) 
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"hp' :hp, 
"attack' attack 
的 二 间 册 琶 二 放 二 个 外 


return data 


def monster (name, hp, monster type): 
def walking (m): 
print ("monster $s : Walkingl"sm['name']) 


data={ 
‘'name':name, 
"hp' :hp, 
'type':monster type, 
'walking' :walking 

} 


return data 


这 样 ,从 代码 结构 上 我 们 已 经 把 各 自 的 方法 区 分 开 了 。 其 实 , 类 似 这 样 的 做 法 就 已 经 
近似 面向 对 象 的 思想 了 。 最 早 开始 出 现 面 向 对 象 编程 的 想法 也 是 基于 类 似 的 问题 发 展 起 
来 的 。 

当然 ,这 里 只 考虑 了 一 点 点 , 随 着 程序 复杂 度 的 增加 ,需要 解决 的 问题 会 更 多 。 不 过 ， 
像 这 样 将 函数 和 变量 封装 到 一 起 的 结构 就 是 类 ,有 专门 的 关键 字 , 在 后 面 将 详细 介绍 。 现 
在 你 有 一 个 初步 的 印象 就 好 ,不 用 着 急 弄 懂 所 有 的 东西 。 


> 下放 才 从 面向 过 程 到 面向 对 象 


之 前 所 介绍 的 解决 问题 的 方法 都 是 面向 过 程 的 ,所 谓 的 面向 过 程 就 是 解决 问题 的 步 
又 ,每 一 步 要 做 什么 都 要 安排 好 。 

面向 过 程 的 好 处 是 降低 了 写 程序 的 复杂 度 , 只 要 顺 着 程序 员 的 思路 写 就 可 以 一 步 一 步 
解决 问题 ;但 缺点 也 很 明显 ,就 是 在 这 个 过 程 中 只 要 有 一 步 需要 改动 ,有 可 能 整个 代码 就 得 
“大 换血 ”。 

习惯 了 面向 过 程 ,初学 编程 的 人 刚 开始 学 习 面 向 对 象 会 有 点 别扭 ,主要 是 在 理解 上 。 
面向 对 象 的 程序 设计 核心 是 对 象 ,通过 对 象 与 对 象 之 间 的 联系 来 完成 任务 。 程 序 中 什么 都 
可 以 作为 对 象 ,需要 什么 创建 什么 ,比如 你 要 设计 一 个 韶关 游戏 , 先 设 计 了 一 堆 英 雄 人 物 ， 
每 个 人 都 有 各 自 的 特征 和 技能 ,其 实 每 个 人 都 是 对 象 ,包含 各 自 的 属性 (特征 ) 和 方法 ( 技 
能 )。 只 有 英雄 的 游戏 没有 意思 ,就 再 设计 一 群 怪物 来 的 乱 ,或 者 英雄 之 间 也 可 争斗 。 总 
之 ,每 个 都 是 对 象 。 程 序 员 只 需要 创建 这 些 对 象 ,至 于 他 们 是 怎么 进行 游戏 并 取得 最 终 胜 
利 的 根本 不 用 管 。 

面向 对 象 的 优点 是 降低 了 程序 本 身 的 复杂 性 ,复杂 性 降低 意味 着 bug 少 ,bug 少 就 意味 
着 可 维护 性 高 。 缺 点 是 可 控 人 性差, 因为 面向 对 象 不 像 面 向 过 程 那样 精准 地 预测 问题 处 理 的 
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流程 与 结果 ,面向 对 象 是 依靠 对 象 与 对 象 之 间 的 关联 来 解决 问题 ,所 以 ,如 果 有 个 别 对 象 失 
误 , 会 导致 程序 运行 出 问题 。 

面向 过 程 的 开发 更 适合 简单 的 或 者 稳定 性 高 不 需要 太 灵 活 的 程序 ,而 面向 对 象 则 适合 
庞大 的 程序 的 处 理 , 后 面 我 们 介绍 的 很 多 工具 都 是 面向 对 象 开 发 的 。 

学 习 面向 对 象 的 程序 设计 ,有 些 概 念 需要 在 头脑 里 先 形成 一 个 基本 的 印象 ,这 样 有 助 
于 面向 对 象 的 学 习 。 

面向 对 象 (简称 OOP) 是 现在 比较 普遍 的 编程 方法 ,主要 用 于 日 益 复杂 的 编程 项 目 。 
OOP 其 实 不 是 什么 语法 结构 , 它 是 一 个 概念 , 即 程序 由 对 象 组 成 ,每 个 对 象 都 可 与 程序 中 其 
他 对 象 进行 交互 。 同 一 类 对 象 的 数据 和 函数 抽象 打包 到 类 中 。 

(1) 类 (class) : 用 来 描述 具有 相同 属性 和 方法 的 对 象 的 集合 。 它 定义 了 该 集合 中 每 个 
对 象 所 共有 的 属性 和 方法 。 类 是 对 象 的 抽象 化 。 

(2) 类 变量 : 类 变量 在 整个 实例 化 的 对 象 中 是 公用 的 。 类 变量 定义 在 类 中 且 在 函数 体 
之 外 。 类 变量 通常 不 作为 实例 变量 使 用 。 

(3) 实例 化 (instantiation) : 创建 一 个 类 的 实例 的 动作 ,类 的 具体 对 象 。 

(4) 实例 变量 : 定义 在 方法 中 的 变量 ,只 作用 于 当前 实例 的 类 。 

(5) 对 象 /实例 (objectUinstance) : 对 象 是 通过 类 定义 的 数据 结构 的 实例 。 对 象 包括 两 
个 数据 成 员 ( 类 变量 和 实例 变量 ) 和 方法 。 

(6) 面向 对 象 三 大 特性 : 封装 .继承 和 多 态 。 这 三 个 特性 会 在 后 续 介 绍 中 详细 说 明 , 深 
入 了 解 后 能 更 准确 地 理解 这 三 个 特性 的 意义 。 

不 用 急于 弄 明白 这 些 概 念 的 意义 , 先 在 脑子 里 留 下 印象 ,在 接 下 来 的 内 容 中 我 们 会 逐 
一 学 习 。 


(> 下 > 卫 类 和 对 象 


Python 遵循 标准 的 面向 对 象 编程 模型 ,理解 面向 对 象 编程 的 途 
径 很 多 ,这 是 一 个 适应 过 程 ,不 用 急于 理解 所 有 概念 。 

在 这 里 我 们 对 类 的 定义 是 建立 新 对 象 的 模板 ,而 利用 这 个 模板 所 
创建 的 对 象 称 为 这 个 类 的 实例 ,类 和 对 象 的 关系 好 像 汽 车 工厂 和 所 制 
造 的 汽车 ,通常 有 一 整套 标准 流水 线 , 这 个 流水 线 可 以 生产 出 无 数 辆 
车 ,而 且 都 具备 相同 的 一 些 属性 ,比如 颜色 、 材 质 、 组 成 的 零件 等 ,也 具 
备 相 同 的 方法 ,比如 启动 \ 前 进 、 后 退 、 刹 车 等 。 

类 的 概念 可 以 联想 到 数据 类 型 ,我 们 讲 过 的 大 部 分 数据 类 型 都 可 以 看 作 模板 ,比如 str 
是 类 型 ,'a'、'b','c' 都 是 字符 串 类 型 的 实例 。 在 str 这 个 类 型 中 定义 了 字符 串 的 属性 和 方法 ,所 
有 字符 串 对 象 都 可 以 调用 这 个 类 型 当中 的 方法 ,不 同 的 对 象 又 都 具备 不 同 特点 ,比如 各 自 
的 值 。 

现实 中 也 可 以 找到 各 种 各 样 的 类 以 及 与 其 对 应 的 对 象 ,你 可 以 看 看 周围 试 着 把 它们 抽 
象 成 类 ,比如 看 见 电 视 、 空 调 就 可 以 抽象 为 家 电 类 ,属性 就 是 颜色 、 材 质 等 ,方法 就 是 开机 、 
运行 等 。 

现在 我 们 来 一 步 步 创建 一 个 类 并 且 逐 一 认识 其 中 的 组 成 元 素 ,Python 使 用 class 关键 
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字 创 建 类 ,基本 的 格式 为 


class 类 名 : 
语句 
class 关键 字 后 跟 类 名 ,类 名 命名 规则 同 变量 ,如 果 有 多 个 单词 ,习惯 上 首 字母 大 写 , 冒 
号 后 代表 进入 类 内 部 的 语句 ,需要 缩 进 。 
先 来 看 一 个 简单 的 类 和 实例 化 后 的 对 象 的 工作 过 程 ,以 便 对 类 有 一 个 整体 印象 。 定 义 
一 个 三 角形 类 ,这 个 类 型 的 对 象 都 具备 三 条 边 , 对 象 都 可 以 求 自 己 的 周 长 。 


#triangle class.PY 
class Triangle: 
def init _(self, x, y, 2): 
self.a=x 
self.b =Y 
self.c=2z 
def perimeter (self): 
return self.a+ self.b+self.c 


#main 

tl = Triangle(3,4,5) 
t2 = Triangle(9,9,9) 
print (tl1.perimeter ()) 
print (t2.perimeter ()) 


结果 如 下 : 


直角 三 角形 周 长 = 12 
等 边 三 角形 周 长 = 27 


在 这 个 例子 中 ,有 

(1) class 定义 了 一 个 Triangle 类 。 

(2) __init__ 叫 作 构造 函数 ,用 来 初始 化 对 象 。 

(3) __init__ 中 定义 了 三 个 属性 a、b、c, 前 面 必须 加 self. 前 级 ,在 类 内 部 调用 时 必须 使 
用 self 访问 ,在 实例 化 对 象 时 通过 x、y、z 传 给 对 象 。 

(4) 类 当中 定义 的 函数 perimeter 就 是 对 象 的 方法 , 形 参 中 第 一 个 必须 是 self ,用 于 在 
类 内 部 传 值 。 

(5) 主 程序 中 通过 类 实例 化 了 两 个 对 象 tl 和 t2, 通 过 调用 perimeter 方法 得 到 对 应 的 
返回 值 。 


> 下 > 克 恒 属性 和 方法 


属性 和 方法 是 类 的 两 个 成 员 , 只 面向 对 象 编程 特有 的 概念 。 属 性 就 是 类 所 封装 的 数 
据 , 方 法 即 类 对 数据 进行 的 操作 。 


152 


9.4.1 类 的 属性 


属性 其 实 就 是 变量 , 跟 变量 一 样 有 作用 域 ,而 且 根 据 定义 的 方式 不 
同 会 有 不 同 的 效果 。 通 过 一 个 例子 认识 一 下 类 的 属性 。 


>>>class Ren: # 定 义 "Ren" 类 
name = "Ren" # 类 属性 .公有 属性 
__money=0 # 私 有 属性 ,前 加 双 下 划 线 
>>>print (Ren.name) # 通 过 类 名 可 以 直接 调 取 类 属性 
Ren 


>>>print (Ren. _money) # 调 取 私 有 属性 失败 
Traceback (most recent call last): 
File "<pyshell#5>", line 1, in <module> 
Print (Ren._ _money) 


AttributeError: type object 'Ren' has no attribute'_ money' 
>>>milo = Ren() # 实 例 化 对 象 milo 

>>>print (milo .name) # 调 取 对 象 的 公有 属性 

Ren 

>>>milo.name = "milo" # 对 象 属性 赋值 

>>>print (milo .name) 

Milo 


>>>print (milo. _ money) # 调 取 私 有 属性 失败 
Traceback (most recent call last) : 
File "<pyshell#12>", line 1，in <module> 
Print (milo. money) 
AttributeError: 'Ren' object has no attribute'__money' 
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通过 这 个 流程 可 以 看 到 类 属性 公有 属性 和 私有 属性 。 类 属性 就 是 公有 属性 可 以 被 类 
直接 调用 ,可 以 在 类 外 被 对 象 直接 调用 。 私 有 属性 在 类 外 部 无 法 直接 调用 (会 报错 ), 如 果 
要 使 用 私有 属性 ,只 能 在 类 内 部 通过 方法 调用 ,私有 属性 实现 是 通过 名 字 来 区 分 的 ,名 字 以 


两 个 下 划 线 开始 。 


私有 属性 的 意义 在 于 保护 数据 , 当 不 希望 在 类 外 部 对 其 属性 进行 操作 时 ,就 需要 使 用 


私有 属性 了 。 


除了 公有 属性 和 私有 属性 之 外 还 有 一 种 内 置 属性 ,是 名 字 前 后 都 有 双 下 划 线 ,通过 dir 


能 看 到 所 有 的 属性 : 


>>>dir (Ren) 
[EPen oney Clas ys" "delottr TEL 





ormat ee gotattribute rs "gqt Mr 

init Subclanse Vr Mer Me CR "Module oe 

HREOCe Jr OO GUOG er er TOPr 0 Hotattr Vr "O20o0FE Uno Nt 
'__subclasshook ',' weakref _', 'name'] 


通过 这 个 结果 可 以 看 到 ,私有 属性 前 面 直接 带 了 类 的 前 缀 ,另外 , 像 __doc__、_init__ 
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这 样 的 就 是 内 置 属 性 和 方法 。 内 置 属性 不 需要 定义 ,是 在 Python 基本 架构 中 就 存在 的 ,在 
下 一 节 我 们 会 介绍 。 


942 类 的 方法 


属性 是 变量 ,方法 其 实 就 是 函数 ,方法 也 分 公有 、 私 有 和 内 置 , 只 是 在 类 中 定义 方法 时 
第 一 个 参数 必须 是 self。 

首先 来 看 内 置 方法 ,通过 三 角形 类 的 演示 ,我 们 已 经 知道 从 类 实例 化 出 对 象 的 方式 ,其 
实 __init__ 并 不 是 必须 要 编写 的 ，_init__ 叫 构造 函数 ,是 用 来 订 制 对 象 的 初始 状态 。 我 们 
通过 __init__ 来 看 一 下 self 的 重要 性 。 

再 次 强调 一 下 : 定义 一 个 类 时 ,实际 上 是 在 定义 一 个 订 制 工厂 函数 ,然后 可 以 在 你 的 代 
码 中 使 用 这 个 工厂 函数 创建 实例 : 


m= MyClass() 


类 名 后 的 小 括号 就 是 告诉 Python 要 创建 一 个 对 象 , Python 在 处 理 这 行 代码 时 ,会 把 工 
厂 函 数 调用 转换 为 以 下 调用 : 


MyClass(). init__(m) 


而 我 们 在 定义 __init__ 时 的 写法 是 这 样 : 


def init _(self): 


# 要 初始 化 给 对 象 的 代码 


通过 这 几 步 ,你 有 注意 到 什么 吗 ? self 实际 上 就 是 对 象 本 身 ,就 是 将 m 赋值 给 self ,这 
个 赋值 很 重要 ,在 之 前 用 函数 模拟 面向 对 象 思想 时 ,没有 这 种 参数 ,所 以 ,实际 上 无 法 真正 
区 分 开 对 象 。 类 的 所 有 对 象 之 间 ,属性 不 共享 ,方法 共享 ,而 类 中 的 这 个 self 就 可 以 知道 方 
法 调用 的 对 象 是 谁 。 

下 面 重新 编辑 一 下 9. 4. 1 小节 中 的 Ren 类 ,将 类 属性 和 对 象 属性 分 开 , 并 且 定 义 相应 
的 一 些 方法 。 


#class ren.py 
class Ren: 
""" 这 里 是 关于 类 的 描述 """ 
className = "Ren" 
def init _(self, name = '', money = 0): # 初 始 化 对 象 属性 
self.name = name 
self. money =money 


def say(self) : # 公 有 方法 
""" 有 必要 的 时 候 , 这 里 是 方法 的 说 明 """ 


print ("I am %s ,i have $d yuan" $ (self.name, self. money)) 


#main 
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if _name ==" main ": 
milo= Ren() # 直 接 实 例 化 对 象 
zqx = Ren ("zouqixian", 100) # 传 参 实 例 化 
milo.say() 
zqx.say() 
print (Ren.className) 
print (Ren.name) # 对 象 属性 ,类 无 法 调用 
运行 效果 如 下 : 
Ren 


Iam ,i have 0 yuan 
I am zouqixian ,i have 100 yuan 
Traceback (most recent call last): 
File 
"C:/Users/milo/Desktop/CrazyPythonZeroToHero/code/9/class ren.py", line 18, in <module> 
print (Ren.name) 
AttributeError: type object 'Ren' has no attribute 'name' 


通过 这 段 代 码 可 以 看 到 以 下 几 点 : 

(1) __init__ 内 定义 属性 的 代码 ,只 有 在 实例 化 时 才 会 执行 ,所 以 通过 类 直接 调用 时 是 
不 会 成 功 的 。 

(2) 私有 属性 可 以 在 类 内 部 通过 方法 调用 ,实例 化 对 象 后 可 以 通过 这 样 的 方法 对 私有 
属性 操作 , 取 值 或 赋值 。 

(3) AttributeError 是 类 当中 最 常见 的 异常 ,属性 和 方法 都 会 报 这 个 异常 。 

私有 方法 的 定义 方式 也 是 通过 在 名 字 前 面 加 双 下 划 线 实现 的 ,你 可 以 实践 一 下 。 私 有 
方法 也 不 能 在 类 外 调用 ,只 能 在 类 内 部 调用 。 


9.4.3 内 置 属 性 和 方法 


Python 中 提供 了 一 些 以 双 下 划 线 开始 且 以 双 下 划 线 结束 的 属性 和 方法 ,类 中 也 有 一 些 
专属 的 属性 和 方法 。 比 如 __doc__, 在 上 一 个 例子 中 写 了 一 些 类 和 方法 的 注释 ,可 以 通 
过 __doc__ 来 看 到 。 


>>>print (zqx. doc ) 


# 这 里 是 关于 类 的 描述 
>>>print (zqx.say. doc ) 
# 有 必要 的 时 候 , 这 里 是 方法 的 说 明 


如 果 你 直接 打印 一 个 对 象 ,得 到 的 结果 会 比较 蜀 涩 ,如 果 想 得 到 一 个 自 定义 的 信息 ,可 
以 利用 __str__ 方 法 : 


>>>class XxX: 
pass 


>>>x = X() 
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>>>print (x) 
<_ main _.X object at 0x05D39650> 


此 时 返回 的 是 这 个 对 象 在 内 存 上 的 地 址 , 重 写 一 下 __str__ 方 法 : 


>>>class xX: 
ef str (sel£)s 
return """this is a instance of class X""" 


>>>X = X() 
>>>print (x) 
this is a instance of class X 


像 __str__ 这 样 的 方法 还 有 个 名 字 , 叫 魔术 方法 ,因为 自动 化 程度 比较 高 ,能 实现 一 些 看 
起 来 有 点 神奇 的 作用 。 

还 有 很 多 内 置 方法 ,就 不 一 一 介绍 了 ,需要 的 时 候 拿 来 用 就 可 以 了 。 最 后 再 说 一 个 析 
构 函 数 __del__。__init__ 是 在 实例 化 对 象 时 自动 执行 ,而 __del__ 则 是 在 释放 对 象 时 自动 执 
行 。 通 常用 来 做 一 些 资源 关闭 的 操作 ,比如 文件 .数据 库 。 


[> 下 > 类 的 继承 


继承 是 面向 对 象 的 三 大 特性 之 一 ,简单 地 说 就 是 一 个 新 类 可 以 通 
过 继承 来 获得 已 有 类 的 方法 和 属性 ,这 个 新 类 也 可 以 自己 定义 新 的 方 
法 和 属性 。 

新 类 通常 被 称 为 子 类 ,被 继承 类 则 称 为 父 类 ,继承 的 格式 如 下 : 


class Son (Father[,Father...]) : 
pass 





继承 的 方式 比较 灵活 ,可 以 继承 一 个 父 类 也 可 以 继承 多 个 。 
9.5.1 使 用 继承 


子 类 继承 父 类 时 ,只 能 继承 父 类 的 公有 属性 和 公有 方法 ,不 能 继承 父 类 的 私有 属性 和 
私有 方法 。 下 面 通 过 实例 来 看 一 下 继承 的 效果 。 

#class fs.py 

class A: 


name = "class A" 


defuoanic (sees 
self.i = "init A" 


def a(self) : 


print ("function a") 
Gs) 
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class B: 
name = "class B" 


def init _(self): 
self.i = "init B" 


def bl(self): 
print ("function b") 


class C(A): 
pass 


class D(B,A): 


pass 
#main 
c=C() 


print("c.name",c.name) 
BEAR 
[or] 


d=D() 
print("d.name",d.name) 
pring( 

d.al() 

qd.b() 


c.name class A 
Ci init A 
function a 
d.name class B 
dG.4 init B 
function a 
function b 


这 个 例子 中 我 们 分 别 定义 了 A 和 也 两 个 类 ,C 继承 了 A,D 继承 了 B 和 A( 注 意 这 个 顺 
序 )。C 只 重新 定义 了 一 个 name 属性 ,D 自身 并 没有 定义 新 的 属性 ,所 以 我 们 在 后 面 看 到 


的 都 是 继承 来 的 。 


C 只 继承 了 A, 所 以 也 就 继承 了 A 的 name 属性 以 及 方法 , 主 程序 中 我 们 直接 通过 名 字 
就 可 以 调用 相关 属性 和 方法 ,就 好 像 自己 定义 的 一 样 ,通过 输出 可 以 看 出 所 有 的 值 也 都 来 
自 于 A, 包括 构造 函数 初始 化 的 值 。 但 是 因为 我 们 在 C 中 重新 定义 了 name, 所 以 name 的 


值 就 是 新 值 。 


D 类 继承 了 两 个 类 , 当 继 承 多 个 类 的 时 候 , 需 要 注意 顺序 问题 ,如 果 多 个 父 类 中 有 相同 


的 属性 或 者 方法 ,只 继承 第 一 个 ,不 会 被 后 面 的 覆盖 。 所 以 A 和 B 类 同样 都 有 name 





属性 ， 
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我 们 看 到 的 就 是 第 一 个 继承 的 B 的 值 。 


952 重 载 


重 载 就 是 在 子 类 中 重新 定义 父 类 方法 ,因为 很 多 时 候 从 父 类 继承 
过 来 的 方法 并 不 能 满足 当前 类 的 需要 。 不 仅 方法 可 以 重 载 , 运 算 符 也 
可 以 重 载 ,比如 “十 “一 ”x* ”“/” 等 ,以 适应 子 类 进行 相关 操作 。 


1. 方法 重 载 
通过 一 个 例子 看 一 下 方法 重 载 。 





#class hb.py 

class Human: 
name = " 
__money=0 


def init _(self, name, money): 
self.name = name 
self. money =money 


def show(self): 
print (self.name) 
print(self. money) 


class Baby (Human) : # 继 承 human 类 
__height =0 # 子 类 新 定义 的 属性 
__weight =0 
= 
def init _(self, name, money, height, weight, sex): # 重 载 _init 方法 
self. height =height # 子 类 对 象 的 新 属性 


Self. weight = weight 
Self. sex= Sex 


Human. init _(self, name, money) # 子 类 中 调用 父 类 方法 


def show(self) : 
Human .show (self) # 调 用 父 类 方法 
print(self. height) 
print(self. weight) 
print(self. _sex) 


#main 


x= Baby("milo", 100, 8, 60, "male") 
x.show() 


运行 结果 如 下 : 


milo 
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在 这 个 例子 中 ,我 们 在 Baby 这 个 子 类 中 定义 了 新 的 属性 , 重 载 了 父 类 的 两 个 方法 ,使 
其 功能 能 够 满足 子 类 的 需求 。 值 得 注意 的 是 ,在 重 载 时 相当 于 对 父 类 继承 过 来 的 方法 进行 
重新 定义 ,就 像 变量 重新 赋值 一 样 。 所 以 , 当 我 们 重 载 父 类 方法 后 又 需要 使 用 父 类 方法 时 ， 
可 以 通过 “ 父 类 名 .方法 名 ”的 方式 直接 调用 。 比 如 这 个 例子 的 两 个 重 载 方法 中 ,我 们 都 直 
接 调用 了 父 类 的 方法 来 获取 父 类 定义 的 属性 。 


2. 运算 符 重 载 


在 Python 中 ,运算 符 也 是 通过 相应 函数 实现 的 , 换 句 话说 ,运算 符 对 应 的 其 实 就 是 类 
中 的 一 些 魔术 方法 ( 专 有 方法 )。 比 如 ,加 、 减 、 乘 、 除 对 应 的 就 是 __add__、_sub mul__ 
__div__。 可 以 在 自 定义 类 中 重 写 这 些 方法 来 实现 一 些 特殊 的 运算 。 

例如 , 想 要 实现 一 个 自 定义 类 ,用 来 生成 一 个 列表 ,然后 重 写 加 \ 减 、 乘 \ 除 的 运算 符 ,从 
而 实现 该 类 的 对 象 的 所 有 元 素 可 以 分 别 进行 运算 ,以 加 法 为 例 。 


#class add.py 
class MyList: 


def _ init _(self, x*args): 
self. myList = [] 
for arg in args: 
self. myList.append(arg) 
def add _(self, x): 
""" 当 对 象 通过 + 符号 对 后 面 数字 运算 就 会 调用 此 方法 """ 
for i in range(len(self. myList)): 
self. myList[i] =self. myList[i] +x 


def show(self): 
print(self. myList) 


#main 


1= MyList (1,2,3,4,5,6,7,8,9,10) 
1.show() 


[1 27 3r 4 357 Gr 7 387 97 10) 
[11, 12, 13, 14, 15, 16, 17, 18, 19, 20] 


当 对 象 后 面 跟 了 “十 ”符号 时 ,就 会 自动 调用 __add_ 方法。 这 样 , 我 们 重 载 _add_ 方 
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法 就 可 以 实现 这 个 例子 的 要 求 了 。 


GE 二 


面向 对 象 的 第 三 个 特性 就 是 多 态 ,不 过 ,多 态 并 不 是 一 个 新 的 语法 结构 。 简 单 地 说 多 
态 指 的 是 一 类 事物 有 多 种 形态 ,比如 ,一 个 抽象 类 有 多 个 子 类 ,因而 多 态 的 概念 依赖 于 
继承 。 

比如 ,序列 类 型 就 有 多 种 形态 : 字符 串 、 列 表 、 元 组 。 

假如 定义 一 个 形状 类 ,形状 类 下 有 三 角形 类 和 正方 形 类 等 ,在 形状 中 有 求 周 长 的 方法 ， 
子 类 中 也 必须 要 实现 这 个 方法 ,而 且 子 类 中 会 有 变化 。 即 同一 个 名 字 的 方法 在 不 同类 中 有 
不 同 的 作用 ,这 种 状态 称 为 多 态 。 


#shape class.py 
class Square: 
def perimeter (self): 


raise AttributerError (" 子 类 须 重 载 此 方法 ,否则 抛 出 这 个 异常 ") 


class Triangle (Square): 
def init _(self, x, y, z) : 


self.a=x 
self.b=y 
self.c=2z 


def perimeter (self): 
print(self.a + self.b + self.c) 


class Shape (Square): 
def init _(self, x): 
self.x=x 
def perimeter (self): 
print(self.x * 4) 


#main 
trianglel = Triangle (3, 4,5) 
shapel = Shape (9) 


trianglel.perimeter () 
shapel .perimeter () 


> 下: 太 有 内 置 装饰 器 


装饰 器 比较 神奇 ,作用 的 原理 是 在 Python 中 可 以 将 函数 作为 参数 传递 ,这 样 就 可 以 通 
过 一 个 函数 改变 另 一 个 函数 的 功能 ,这 个 能 够 改变 其 他 函数 的 函数 称 为 装饰 器 。 

这 里 介绍 三 个 类 内 置 装饰 器 ,实际 上 就 是 三 个 函数 ,用 法 上 很 简洁 ,也 不 需要 知道 这 三 
个 函数 内 部 实现 的 方法 。 
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(1) staticmethod( 类 静态 方法 ) : 与 成 员 方法 的 区 别 是 没有 self 参数 ,并 且 可 以 在 类 不 
进行 实例 化 的 情况 下 调用 。 

(2) classmethod( 类 方法 ) : 与 成 员 方法 的 区 别 在 于 所 接收 的 第 一 个 参数 不 是 self (类 
实例 的 指针 ) ,而 是 cls( 当 前 类 的 具体 类 型 ) 。 

(3) property( 属 性 方法 ) :将 一 个 类 方法 转变 成 一 个 类 属性 , 即 只 读 属性 。 

在 介绍 属性 时 说 过 类 属性 可 以 直接 被 类 调用 ,如 果 要 实现 能 被 类 直接 调用 的 方法 就 可 
以 借助 staticmethod 和 classmethod 了 ,区别 在 于 staticmethod 的 方法 没有 self 参数 ,通常 
用 来 直接 定义 一 个 静态 类 方法 ,如 果 想 将 一 个 普通 动态 方法 变 成 类 方法 就 要 使 用 


classmethod 了 。 


#class_sc.py 
class A: 
@staticmethod 
def sm() : 
print ("静态 方法 ") 


@classmethod 
def cm(self) : 
Print ("类 方法 ") 


a=A() 
A.sm() 
a.sm() 
Mcm() 
a.cm() 


这 里 的 用 法 有 个 @, 比 如 @classmethod 要 加 在 cm 方法 上 面 ,这 样 的 写法 实际 上 是 取 
代 了 cm = classmethod(cm) ,代码 看 起 来 更 简洁 明了 。 

property 的 作用 是 将 一 个 类 方法 转变 成 一 个 类 属性 , 即 只 读 属 性 。 下 面 通过 一 个 例子 
看 一 下 实际 运用 。 


#class pp.py 
class Triangle: 
def init _(self, x, y, 2): 
self.a=x 
Self.b =Y 
self,c=2 
@property 
def perimeter (self): 
return self.a + self.b+self.c 


t= Triangle(6,6,6) 
Print (t.perimeter) 


这 样 ,只 要 经 过 property 装饰 器 处 理 过 之 后 ,就 可 以 将 方法 变 成 属性 了 ,这 在 我 们 要 处 


理 方法 的 值 时 很 方便 。 
(ed 
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> 和: 汉 《英雄 无 敌 》 面 向 对 象 设计 


面向 过 程 的 《英雄 无 敌 ) 你 写 了 吗 ? 现在 是 颠覆 的 时 候 了 。 通 过 
下 面 的 例子 ,来 看 一 下 将 类 作为 模块 使 用 ,这 样 可 以 将 抽象 代码 和 逻 
辑 代 码 分 开 ,我 们 编写 一 个 模块 定义 一 个 英雄 类 和 一 个 敌人 类 ,然后 
看 一 下 类 和 类 之 间 的 关联 。 一 共 两 个 文件 ,一 个 模块 heros. py, 一 个 
逻辑 主 程序 play. py。 





现在 准备 开始 了 ,如 果 你 还 没 想 好 怎么 开发 模 抉 ,可 以 先 想 逻辑 “和 人 
代码 ,比如 ,现在 先 写 play. py。 
#game/play.py 
from heroes import * # 导 入 heros 模块 (1) 
msg =" 欢迎 来 到 英雄 无 敌 的 世界 .…...!" 
if name _==" main _": 
print (msg) 
milo = Hero('milo') # 实 例 化 英雄 (2) 
boss = Element ('boss') # 实 例 化 敌人 (3) 
print ("boss hp:",boss.hp) # 显 示 敌 人 的 HP (4) 
print ("英雄 发 起 攻击 !") 
milo.hit (boss) # 英 雄 调用 hit 方法 攻击 boss 对 象 (5) 
print ("boss hp:",boss.hp) # 显 示 敌 人 的 HP (4) 


其 实 这 个 代码 可 以 一 点 一 点 地 写 ,每 写 一 个 功能 就 去 模块 中 实现 相应 功能 。 比 如 第 
(1) 步 要 导入 heros 模块 ,所 以 可 以 先 创建 这 个 模块 文件 ,第 (2)、(3) 两 步 是 要 实例 化 对 象 ， 
我 们 可 以 去 模块 中 创建 两 个 类 。 


#game/heros.py 
class Hero: 
pass 


class Element: 
pass 


通过 步骤 (2) (3) (4)、(5) ,我 们 知道 Element 类 至 少 需 要 一 个 name 属性 (初始 化 对 
象 赋值 ) ,一 个 hp 属性 , Hero 类 需要 一 个 hit 方法 ,并 且 调 用 hit 方法 后 会 对 Element 的 对 
象 hp 属性 有 影响 。 


#game/heros.py 
class Hero: 
def init _(self,name = 'playerl',hp = 100,atk = 10): 
self.name = name 
self.hp = hp 
self.atk = atk 
print (' 英 雄 ss 诞生 !!'%self.name) 
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def hit (self,name): 
name .hp -= self.atk 


def blood (self): 
pass 


class Element: 
def init _(self,name = 'boss',hp = 1000): 
self.name = name 
self.hp= hp 
print ('BOSS ss 诞生 !!'%self.name) 


def hit (self): 
pass 


根据 需要 ,我 们 创建 了 两 个 类 ,设置 了 相应 的 属性 ,增加 了 一 个 atk 属性 表示 攻击 力 。 
需要 注意 一 下 hit 方法 ,hit 方法 的 第 二 个 参数 实际 上 就 是 另 一 个 对 象 , 所 以 name. hp 实际 
调用 的 是 另 一 个 对 象 的 属性 。 

如 果 你 细心 观察 会 发 现 这 两 个 类 十 分 类 似 , 最 终 Element 也 是 要 有 一 个 hit 方法 的 ,所 
以 这 个 模块 还 可 以 再 抽象 出 一 个 父 类 ,然后 这 两 个 类 去 继承 ,请 你 考虑 一 下 如 何 实 现 。 

至 于 这 个 小 程序 ,模块 写 完 不 用 动 , 只 需要 去 执行 player. py 就 可 以 了 ,效果 如 下 : 


欢迎 来 到 英雄 无 敌 的 世界 .…… ! 
英雄 milo 诞生 !! 

BOSS boss 诞生 !! 

boss hp: 1000 

英雄 发 起 攻击 ! 

boss hp: 990 


硬 重点 提示 


在 这 一 章 中 ,你 要 掌握 的 内 容 : 

(1) 深刻 理解 面向 对 象 程序 设计 。 

(2) 能 够 熟练 创建 类 和 生成 对 象 并 调用 属性 和 方法 。 

(3) 理解 面向 对 象 的 三 大 特性 : 封装 继承、 多 态 。 
3 动 动手 

(1) 设计 一 个 机 动车 类 ,需要 包含 属性 和 方法 ,再 设计 一 个 跑车 类 继承 机 动车 类 。 

(2) 设计 一 个 购物 车 类 实现 购物 网 站 的 购物 车 功 本 
能 ,假设 是 一 个 买书 的 网 站 ,考虑 如 果 有 人 买书 要 把 什 。 国 研 滋 富 加 加 
么 东西 放 在 购物 车 中 ,在 购物 车 中 可 以 执行 哪些 操作 。 E SE 

(3) 设计 一 个 类 ， 并且 被 作为 模块 用 于 对 第 8 章 ee 
的 学 生 信 息 管理 系统 实现 相应 增 、 删 、 改 、 查 操作 。 3 回 i 

(4) 面向 对 象 同样 有 很 多 需要 学 习 的 东西 ,扫描 super 与 新 式 类 和 经 典 类 ”内 置 装饰 器 


(es 
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上 页 的 二 维 码 观看 这 两 个 视频 ,关于 super 与 新 式 类 和 经 典 类 ,还 有 内 置 装饰 器 , 了 解 一 
下 吧 。 

(5) 软件 编程 中 有 一 种 模式 叫 测试 驱动 开发 ,意思 就 是 先 测 试 ,后 
开发 ,如 果 你 感 兴趣 ,这 里 准备 了 一 个 视频 ,扫描 右 侧 二 维 码 即 可 观看 。 

(6) 利用 面向 对 象 思 想 重 新 设计 游戏 《英雄 无 敌 》, 可 自行 考虑 游 
戏 效果 ,以 下 为 参考 。 完 善 ( 英 雄 无 敌 )( 或 实现 类 似 功能 的 ) 游 戏 , 游 戏 
流程 及 功能 如 下 。 

@ 开始 游戏 时 ,要 求 : 给 游戏 添加 一 个 登录 、 注 册 的 功能 ,可 以 多 
账号 ,不 同 账号 不 同 进度 和 等 级 。 注 册 账 号 名 字 为 邮箱 地 址 ,需要 验证 。 密 码 为 6 一 16 位 字 
母 和 数字 的 组 合 , 不 能 全 为 数字 或 字母 。 需 要 将 账号 密码 保存 到 一 个 文件 当中 ,最 好 再 做 
一 个 存 取 游 戏 进 度 的 功能 。 

@ 进入 游戏 后 ,由 用 户 决定 角色 名 字 ; 主 角 有 100HP 血 ,10 点 攻击 力 。 

@ 游戏 开始 后 有 一 个 顺序 十 格 地 图 ,每 一 格 分 左右 两 个 房间 。 

a. 除 起 点 外 在 游戏 中 主角 在 每 一 个 房间 行走 过 程 中 会 出 现 随机 事件 。 比 如 加 血 , 踩 地 
雷 掉 血 ,增加 攻击 力 (每 次 5 点 ), 遇 到 20HP 血 的 小 怪兽 (不 论 输 赢 ,进行 三 回合 战斗 ,互相 
有 损伤 , 跟 攻 击 力 挂钩 ) 。 

b. 走 到 第 十 步 时 是 大 Boss(2000HP 血 ) 。 

c. 双 结 局 任务 设置 ,比如 用 户 进 左 边 的 房间 多 , 则 回合 式 战 斗 ; 如 进 右 边 房间 多 , 则 时 
间 式 战斗 。 

回合 式 战斗 指 每 人 一 次 攻击 ,HP 血 先 为 0 的 一 方 输 。 

时 间 式 战斗 指 有 30 秒 时 间 , 每 2 秒 掉 20HP 血 ,30 秒 内 Boss HP 血 为 0, 则 主角 胜利 ， 
游戏 过 程 中 主角 HP 血 降 到 0 时 ,game over。 





测试 驱动 开发 


异常 处 理 


异常 就 是 程序 运行 过 程 中 引发 的 错误 。 相 信 你 在 前 面 的 练习 和 实 
验 中 已 经 遇 到 过 很 多 次 ,在 前 面 的 内 容 中 我 也 有 意 提示 你 留意 出 现 过 
的 异常 ,如 果 你 这 样 做 了 ,应 该 会 发 现 异 常 并 不 是 每 个 都 不 同 ,经 常 出 
现 的 就 是 有 限 的 那 几 个 。 

比如 ,在 序列 操作 中 会 碰 到 索引 越界 ,打开 的 文件 不 存在 ,做 除法 
除数 为 0 等 ,通常 遇 到 这 些 问 题 时 ,程序 会 自动 终止 ,我 们 在 之 前 通过 
条 件 语句 可 以 适当 避免 一 些 , 但 是 很 有 限 。 在 部 分 例子 中 也 介绍 了 异常 处 理 的 方法 , 即 
try, 这 也 是 程序 员 用 来 解决 问题 的 最 好 方法 。 

Python 中 提供 了 非常 完善 的 异常 处 理 机 制 。 异 常 处 理 可 以 帮助 程序 员 提 高 程序 的 健 
壮 性 ,并 不 是 预防 异常 不 让 它 发 生 , 而 是 在 异常 发 生 时 ,系统 不 会 强行 终止 程序 ;是 执行 预 
设 的 异常 处 理 代 码 ,执行 完毕 后 ,程序 还 会 继续 执行 下 去 。 所 以 掌握 异常 的 处 理 对 于 程序 
员 来 说 是 很 重要 的 。 


(>2 异常 


学 习 异 常 处 理 , 首 先是 要 正确 认识 程序 出 现 的 错误 ,有 些 是 不 属于 异常 处 理 范围 的 。 
程序 运行 常见 错误 主要 有 3 类 : 语法 错误 、 逻 辑 错误 及 运行 错误 。 

(1) 语法 错误 就 是 我 们 在 讲 基础 语法 时 所 说 的 那些 不 符合 语法 规则 的 语句 所 产生 的 错 
误 , 比 如 数据 类 型 错误 ,符号 错误 ,关键 字 不 匹配 表达 式 不 完整 等 ,Python 在 运行 程序 时 会 
对 这 些 语 法 错误 进行 检测 并 诊断 ,其 实 这 些 错 误 都 是 需要 程序 员 进 行 检 查 纠正 的 ,这 些 都 
不 属于 异常 处 理 范围 。 

(2) 逻辑 错误 是 指 程序 运行 的 过 程 和 结果 没有 按照 程序 员 所 设想 的 方式 执行 ,比如 条 
件 语 句 或 者 循环 语句 设计 错误 ,代码 执行 的 先后 顺序 不 对 ,设计 的 算法 不 对 等 ,这 些 也 不 属 
于 异常 。 

(3) 运行 错误 是 程序 运行 过 程 中 除 以 上 两 个 问题 之 外 出 现 的 错误 ,比如 文件 打 不 开 、 对 
象 未 定义 、 索 引 越界 等 ,这 些 都 是 异常 。 

异常 处 理 的 意义 在 于 开发 者 能 提供 错误 发 生 时 要 调用 的 代码 。 当 程序 出 现 错误 时 ， 
Python 不 再 是 简单 终止 ,而 是 会 搜索 程序 员 提供 的 遇 到 相应 问题 时 要 执行 的 代码 。 如 果 找 
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到 针对 出 现 的 错误 要 被 调用 的 代码 ,就 会 执行 被 调用 代码 ;如 果 找 不 到 异常 处 理 的 代码 , 则 
会 报错 。 


Python 的 异常 类 


我 们 在 之 前 看 到 的 异常 只 是 个 名 字 , 其 实 这 些 都 是 异常 对 象 , 即 Python 抛 出 的 异常 都 
是 类 。 比 如 定义 一 个 变量 ,然后 以 错误 的 名 字 调 用 : 


>>>a = 100 
>>>print (A) 
Traceback (most recent call last): 
File "<pyshell#5>", line 1, in <module> 
print (A) 
NameError: name 'A' is not defined 


这 可 能 是 我 们 在 学 习 变 量 时 就 遇 到 的 异常 ,现在 你 看 到 最 后 一 行 的 NameError, 应 该 
能 知道 这 是 一 个 名 字 错 误 ,具体 的 错误 就 是 冒号 后 面 说 的 A 这 个 名 字 没 有 被 定义 ,其 实 这 
就 是 程序 引发 了 一 个 NameError 异常 。 

像 这 样 的 内 置 异常 类 ,Python 提供 了 很 多 ,可 以 查看 手册 , 表 10-1 是 一 些 常 见 的 异 
常 类 。 


表 10-1 Python 常见 异常 类 
































异常 类 名 描 述 
Exception 所 有 异常 的 基 类 
NameError 尝试 访问 不 存在 的 变量 名 
ImportError 导入 模块 引发 的 异常 
SyntaxError 语法 错误 
IndexError 索引 越界 
IOError 1/O 错误 ,比如 打开 不 存在 的 文件 
KeyError 调用 字典 中 不 存在 的 键 
AttributeError 尝试 访问 未 知 的 对 象 属性 
ValueError 函数 传 参 类 型 不 正确 


知己 知 彼 , 百 战 不 殖 。 熟 悉 了 Python 内 置 的 异常 类 ,才能 更 好 地 处 理 , 当 然 , 你 也 可 以 
从 实战 中 不 断 提升 ,也 就 是 碰 到 异常 再 处 理 , 不 过 ,这 样 有 些 被 动 ,最 好 的 办 法 还 是 主动 出 
击 , 提 前 设置 异常 处 理 。 

图 10-1 是 Python 3. 6 手册 的 异常 树 截 图 ,Python 标准 库 (Library Reference) 中 找到 
built-in Exception 这 一 节 就 能 看 到 完整 版 。 
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BaseException 
+-- SystemExit 
+-- KeyboardInterrupt 
+-- GeneratorExit 
+-- _ Exception 
+-- StopIteration 
- StopAsyncIteration 
-- ArithmeticError 
+-- FloatingPointError 
+-- OverflowError 
+-- ZeroDivisionError 
- AssertionError 
- AttributeError 
- BufferError 
- EOFError 
- ImportError 
+-- ModuleNotFoundError 
- LookupError 
+-- IndexError 
+-- KeyError 
- MemoryError 
- NameError 
+-- UnboundLocalError 


图 10-1 内 置 异常 类 结构 树 


人 


ai 捕获 和 处 理 异常 
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异常 分 为 两 个 阶段 : 引发 异常 的 错误 ;检测 并 处 理 异常 。 异常 处 理 的 基本 流程 如 下 。 


(1) 监测 特定 语句 。 


(2) 被 检测 语句 如 果 出 现 错误 或 者 发 生 异 常 , 则 中 止 执行 错误 代码 。 


(3) 抛 出 (引发 ) 特 定 异 常 。 
(4) 寻找 捕获 器 来 捕捉 并 处 理 相应 的 异常 。 


(5) 如 果 有 捕获 程序 , 则 跳 转 到 异常 处 理 的 代码 ;如 果 没 有 捕获 程序 , 则 直接 由 Python 


抛 出 异常 并 中 止 程 序 。 
10.31 try.…except.… 语 句 


Python 处 理 异 常 的 基本 语句 是 try.…except… 语 句 ,语句 块 要 采用 4 格 缩 进 的 规范 ， 


Python 3 中 的 语法 如 下 : 


try: 
语句 块  # 被 监控 的 语句 ,错误 在 此 出 现 ,Python 检查 异常 类 型 
except Exception["as" identifier]: # 捕 获 异常 及 异常 信息 
语句 块  # 处 理 异常 的 语句 ,执行 后 会 跳 过 其 他 异常 块 
except Exception["as" identifier]: 
语句 块  # 处 理 异常 的 语句 
except Exception["as" identifier]: 
语句 块  # 处 理 异常 的 语句 
主 程序 # 在 try...except.. 之 后 继续 执行 


注意 : 这 个 结构 在 Python 2 中 ,except 语句 为 
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except Exception,identifier: 
下 面 通过 try..….except.… 将 10. 2 节 变 量 不 存在 的 例子 中 的 异常 处 理 掉 。 


#try name.py 
Cys 

a=100 

print (A) 
except NameError: 


print ("变量 名 不 存在 ") 
输出 结果 : 
>>> 变 量 名 不 存在 


这 里 我 们 将 可 能 出 错 的 代码 放 到 try 的 代码 块 中 执行 。 如 果 没 有 异常 就 正常 执行 完 
毕 , 不 会 执行 到 except 的 代码 ;如 果 有 异常 抛 出 , 则 执行 except 的 代码 ,except 后 面 跟 的 就 
是 你 要 捕捉 的 异常 类 的 名 字 , 如 果 这 个 异常 类 不 是 上 面 try 语句 所 抛 出 的 ,就 意味 着 与 没有 
做 异常 处 理 一 样 ,你 该 看 见 的 报错 还 是 会 出 现 ,程序 也 会 中 止 。 这 个 例子 中 抛 出 和 捕获 的 
异常 是 对 应 的 ,在 接收 到 异常 之 后 就 会 执行 except 语句 的 代码 块 ,在 这 里 是 为 了 给 用 户 一 
个 友好 的 中 文 反馈 。 


10.32 try...except...else 语句 


如 果 有 多 个 异常 需要 处 理 可 以 通过 罗列 多 个 except 语句 实现 ,如 果 try 的 代码 块 没 有 
任何 异常 抛 出 ,还 可 以 利用 else 执行 一 段 代 码 。 在 if、for、while 等 语句 中 已 经 见 过 else, 异 
常 处 理 的 else 语句 的 代码 块 是 在 try 语句 代码 块 没有 异常 时 执行 ,下 面 举例 说 明 一 下 多 个 


except 加 else。 


#try except n.py 
try: 
x = input ("被 除数 :") 
Y = input ("除数 :") 
z= int(x) / int (y) 
except ValueError: 
print ("请 输入 数字 !") 
except ZeroDivisionError: 
print ("除数 不 能 为 0") 
else: 
Print ler A ye me 


如 果 输 入 的 值 不 是 数字 就 会 抛 出 ValueError 异常 ,处理 后 输出 提示 信息 ,不 执行 else。 
被 除数 :a 


除数 :a 
请 输入 数字 ! 
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如 果 除 数 是 0, 效 果 如 下 。 


被 除数 :10 
除数 :0 
除数 不 能 为 0 


没有 异常 就 会 执行 else 语句 的 代码 块 ,效果 如 下 。 


被 除数 :10 
除数 :2 
10 /2 0 


10.3.3 finally 子 句 以 及 嵌 套 


finally 语句 的 代码 块 ,不 管 有 没有 异常 都 会 执行 。finally 通常 会 和 try.…except.… 组 合 
使 用 , 那 有 什么 是 必须 要 执行 的 呢 ? 很 多 需要 我 们 强制 关闭 的 对 象 都 需要 ,比如 对 一 个 文 
件 操作 ,无 论 是 否 有 异常 ,最 后 都 要 关闭 文件 ,这 种 情况 就 适用 于 finally, 我 们 来 看 一 个 
例 于 。 


#try file.py 
try: 
f= open("test.txt", 'r') 
print (f.read()) 
except IOError: 
print ("文件 不 存在 ") 
finally: 
#f.close() 
try: 
f.close() 
except NameError: 
pass 


在 try 中 读 取 文 件 ,可 能 会 出 现 要 打开 的 文件 不 存在 的 问题 ,这 就 会 引发 IOError, 将 其 
捕获 即 可 ,文件 对 象 用 完 之 后 要 关闭 ,在 finally 子 句 中 可 以 直接 将 f. close() 关 掉 , 但 是 这 行 
代码 还 可 能 产生 异常 。 如 果 前 面 打 开 文 件 失败 ,就 不 会 有 f 对 象 ,那么 f. close() 就 会 报 
NameError 异常 ,既然 会 有 异常 ,那么 就 再 次 嵌 套 一 个 try 即 可 。 


10.3.4 谁 都 跑 不 了 


在 异常 手册 中 可 以 看 到 ,异常 的 种 类 很 多 ,我 们 不 可 能 把 所 有 的 异常 一 一 捕获 。 你 还 
会 发 现 , 所 有 异常 的 最 顶层 其 实 是 BaseException 类 ,所 以 ,有 个 终极 大 招 就 是 直接 捕获 
BaseException 类 ,这 样 , 所 有 的 异常 都 跑 不 掉 了 。 

现在 就 写 一 个 函数 ,把 参数 转 为 整数 。 

#try int 


def toInt (x): 
try: 


A 
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i= int(x) 
except BaseException as err: 
i=err 


returni 


print (toInt ('abc')) 
print (toInt ("123")) 
print (toInt ([456])) 


每 个 错误 都 不 同 ,所 以 捕获 的 异常 也 都 不 同 , 结 果 如 下 : 


invalid literal for int() with base 10: 'abc' 
123 


int() argument must be a string, a bytes- like object or a number, not '1ist' 


抛 出 异常 


现在 了 解 Python 会 在 发 生 错 误 时 自动 抛 出 异常 ,我 们 也 可 以 自己 主动 抛 出 异常 ,除了 
内 置 异常 外 ,还 可 以 自 定义 异常 类 。 主 动 抛 出 异常 不 是 为 了 制造 麻烦 ,而 是 为 了 引导 程序 
向 正确 的 方向 运行 ,比如 要 检查 用 户 输入 的 数据 ,如 果 不 符合 要 求 就 主动 引发 异常 ,并 向 异 
常 传递 数据 。 


10.4.1 raise 语句 


raise 语句 是 Python 提供 的 一 种 自行 引发 异常 的 机 制 。 我 们 可 以 在 raise 语句 中 指定 
异常 类 型 以 及 附加 的 异常 信息 。raise 语句 的 常用 语法 如 下 : 


raise 异常 类 名 (附加 异常 信息 ) 


比如 要 检测 一 个 字符 串 长 度 , 如 果 长 度 大 于 5 则 抛 出 异常 ,并 且 配 合 try 来 捕获 我 们 自 
己 抛 出 的 异常 。 


#raise exception 
Sm "123456" 
try: 
if len(s) > 5: 
#raise Exception 
raise Exception ("超过 5 个 字符 ") 
except Exception as err: 
print (err) 


符合 让 条 件 , 由 raise 抛 出 一 个 exception 异常 以 及 括号 中 的 提示 信息 ,这 样 捕捉 到 蜡 
常 后 就 可 以 得 到 这 个 信息 ,当然 ,也 可 以 没有 提示 信息 ,就 像 注释 行 那样 ,结果 如 下 。 


超过 5 个 字符 
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10.42 自 定义 异常 类 


如 果 内 置 异常 类 中 没有 符合 程序 要 抛 出 的 异常 类 型 ,我 们 也 可 以 自 定义 异常 类 。 在 
Python 中 ,可 以 通过 继承 Exception 类 来 创建 自己 的 异常 类 ,而 且 通常 只 需要 定义 几 个 属 
性 就 可 以 了 。 下 面 就 来 自 定义 一 个 异常 类 ,并 在 需要 时 抛 出 。 


#my error class.py 
class MyError (Exception): 
def init _(self, length, least): 
self.length = length 
self.least = least 


if name ==" main _": 
trys 
s = input (" 请 输入 一 个 字符 串 :") 
if len(s) > 5: 
raise MyError (len(s), 5) # 抛 出 自 定 义 异 常 并 传 参 
except MyError as m: 


print ("MyError: 输入 长 度 为 $s, 长 度 不 能 超过 %d" % (m.length, m.1least)) 


这 个 异常 类 定义 好 之 后 , 跟 内 置 类 的 用 法 一 样 ,在 需要 时 raise 出 来 就 行 了 ,结合 面向 对 
象 的 知识 再 反观 异常 类 , 抛 出 来 的 其 实 就 是 一 个 对 象 , 通 过 调用 对 象 的 属性 和 方法 来 获取 
更 多 的 信息 ,结果 如 下 : 


> 


请 输入 一 个 字符 串 :abc 


>>> 
请 输入 一 个 字符 串 :abcdefg 
MyError: 输入 长 度 为 7, 长 度 不 能 超过 5 


10.4.3 assert 语句 


assert 语句 同样 可 以 抛 出 异常 ,主要 用 在 判断 表达 式 中 ,表达 式 为 真 时 ,什么 都 不 做 ; 表 
达 式 为 假 时 , 则 抛 出 异常 。 例 如 : 


>>>assert "abc" == "abc" 
>>>assert "abc" == "abcdef" 
Traceback (most recent call last): 
File "<pyshell#1>", line 1, in <module> 
assert "abc" == "abcdef" 
AssertionError 


可 以 看 到 ,表达 式 为 假 时 直接 抛 出 了 一 个 AssertionError 异常 ,也 可 以 把 assert 看 作 是 
简化 的 raise ,其实 看 起 来 就 像 if 和 raise 结合 的 结果 。 当 然 , 这 个 异常 也 是 可 以 捕获 的 。 


(有 


>>>try: 














assert "abc" == "abcdef" 
except AssertionError: 
print ("Error") 


输出 结果 : 


Error 


| 硬 重点 提示 


在 这 一 章 中 ,你 要 掌握 的 内 容 : 
(1) 知道 常见 异常 代表 的 意义 。 
(2) 能 够 捕获 异常 并 处 理 。 
(3) 掌握 异常 的 几 个 语句 。 
(4) 会 自 定义 异常 类 。 


和 动 动手 


(1) 编写 程序 实现 用 户 输入 两 个 值 ,由 程序 执行 除法 ,通过 异常 处 理 非 数 字 的 错误 、 除 
数 为 0 的 错误 以 及 运行 过 程 中 可 能 出 现 的 其 他 错误 ,如 果 不 确定 异常 名 字 , 可 以 先 试 错 。 

(2) 系统 提供 的 内 建 函数 open() ,在 打开 文件 时 不 能 处 理 异 常 ,请 改进 open() 并 封装 
一 个 新 的 函数 , 当 程 序 刚 打开 文件 时 直接 返回 句柄 ,如 果 发 生 异 常 则 返回 None, 并 且 不 报 
异常 。 
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现在 ,我 们 所 有 涉及 与 用 户 交 互 的 程序 都 是 在 IDLE 或 者 终端 中 的 命令 行 模式 , 即 是 纯 
文本 的 。 对 于 学 习 来 说 这 已 经 足够 了 ,但 是 如 果 想 要 让 程序 对 用 户 来 说 更 友好 ,这 显然 是 
不 够 的 。 

因为 对 于 用 户 来 说 ,在 生活 中 能 涉及 的 与 程序 互动 的 方式 ,大 多 数 都 是 图 形 化 的 ,比如 
计算 机 上 安装 的 各 种 各 样 的 软件 .手机 上 的 应 用 程序 等 ,全 部 都 是 图 形 化 的 。 

所 以 我 们 现在 来 了 解 一 下 如 何 用 Python 开发 图 形 化 的 用 户 界面 ,在 这 一 章 里 我 们 会 
设计 一 些 简单 的 GUI。 还 是 那 句 话 ,这 是 一 个 人 门 的 过 程 , 不 是 一 个 字典 似 的 资料 库 , 我 们 
要 做 的 是 掌握 方法 。 就 像 拼 积木 ,我 们 现在 要 掌握 怎么 搭 一 个 小 房子 ,你 只 要 会 搭 小 房子 ， 
就 可 以 一 点 一 点 拱 起 一 个 高 楼 了 。 


> 区 用 轴 上 GUI 


GUI 是 图 形 用 户 界面 (Graphical User Interface) 的 简称 ,又 称 图 形 用 户 接口 ,是 指 采 用 
图 形 方式 显示 的 计算 机 操作 用 户 界面 。 用 户 可 以 通过 GUI 与 程序 进行 交互 ,这样 做 的 好 处 
是 减少 用 户 的 学 习 成 本 , 稍 有 GUI 使 用 经 验 的 用 户 都 可 以 快速 上 手 一 个 新 的 程序 。 

Python 有 非常 丰富 的 GUI 框架 ,Python wiki GUI programming 给 出 了 超过 30 个 跨 
平台 框架 方案 ,包括 Pyjamas 这 样 的 跨 浏 览 器 Web 开发 框架 。 下 面 介绍 其 中 的 几 个 。 


1. tkinter 


tkinter( 也 叫 Tk 接口 ) 是 Python 内 置 的 标准 GUI 库 。tkinter 是 一 个 轻 量 级 的 跨 平台 
图 形 用 户 界 面 (GUI) 开 发 工具 ,可 以 运行 在 大 多 数 的 UNIX 平台 、Windows 和 Macintosh 
系统 。tkinter 用 起 来 也 非常 简单 ,Python 自 带 的 IDLE 就 是 tkinter 实现 的 ,包括 我 们 在 前 
面 用 简 括 turtle 绘图 、 画 正弦 波 等 图 形 的 呈现 界面 也 都 是 tkinter 实现 的 。 


2. wxPython 


wxPython 是 Python 语言 实现 的 一 套 优 秀 的 GUI 图 形 库 ,允许 Python 程序 员 很 方便 
地 创建 完整 的 ,功能 键 全 的 GUI。wxPython 是 作为 优秀 的 跨 平台 GUI 库 wxWidgets 的 
Python 封装 和 Python 模块 的 方式 提供 给 用 户 的 。 其 功能 要 强 于 tkinter, 相 比较 来 说 更 适 
合 开发 大 型 的 GUI 应用。 
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3. Qt 


Qt 是 一 个 C++ 编写 的 跨 平台 开发 框架 ,如 果 你 的 应 用 是 完全 开源 的 ,就 可 以 免费 使 用 
Qt, 否 则 你 需要 购买 商业 许可 。Qt 已 经 存在 很 久 ,一 度 属于 诺基亚 公司 ,作为 一 个 非常 全 
面 的 工具 代码 库 和 API, 被 大 量 行业 广泛 采用 ,覆盖 包括 移动 在 内 的 多 个 平台 。 卫 星 导 航 应 
用 的 图 形 用 户 界面 往往 就 是 Qt 开发 的 。 


4. Kivy 


Kivy 是 一 个 非常 有 趣 的 项 目 , 它 基 于 OpenGL ES 2, 支 持 Android 和 iOS 平台 的 原生 
多 点 触摸 ,作为 事件 驱动 的 框架 ,Kivy 非常 适合 游戏 开发 和 处 理 从 widgets 到 动画 的 任务 。 
如 果 你 想 开发 跨 平 台 的 图 形 应 用 ,或 者 仅仅 需要 一 个 强大 的 跨 平台 图 形 用 户 开发 框架 ， 
Kivy 是 不 错 的 选择 。 

如 果 对 GUI 要 求 不 是 很 高 ,可 以 直接 用 tkinter。 学 习 使 用 一 个 新 的 框架 不 像 学 习 一 
门 计算 机 语言 那么 难 , 学 习 GUI 编程 ,并 不 是 在 学 习 Python 语言 ,而 是 在 学 习 一 个 计算 机 
工具 怎么 使 用 。 


(> BA tkinter 


作为 内 置 标准 库 的 tkinter, 用 起 来 很 简单 ,但 是 文档 和 功能 上 相 国难 
比 其 他 第 三 方 框架 要 差 很 多 ,不 过 基本 的 GUI 开发 还 是 没 问题 的 ,我 
们 通过 tkinter 来 做 个 热身 ,熟悉 一 下 GUI 开发 吧 。 

用 tkinter 开发 GUI, 可 以 先 想 象 一 下 在 底板 上 拼图 ,要 先 拿 一 块 
空白 底板 ,然后 拿 现成 的 组 件 摆 在 上 面 组 成 完整 的 布局 。 


1.24 创建 空白 窗口 


用 tkinter 开发 GUI 需要 先导 和 tkinter 模块 ,这 个 模块 不 需要 安装 ,直接 导入 即 可 ,可 
以 在 交互 模式 下 试 一 下 : 





>>>import tkinter 


如 果 没 有 异常 就 表示 模块 可 用 。 
导入 模块 后 ,第 一 步 要 做 的 是 生成 一 个 主 窗 口 对 象 (想象 那个 空白 底板 )。 第 二 步 是 通 
过 tkinter 模块 的 其 他 函数 方法 等 对 主 窗口 对 象 添加 组 件 。 创 建 主 窗口 只 需要 3 行 代码 。 


>>> import tkinter 
>>>root = tkinter.Tk() 
>>>root .mainloop() 


其 中 ,第 一 行 导 和 模块 ,第 二 行 实例 化 主 窗口 对 象 ,第 三 行进 入 消息 循环 。 这 时 就 可 以 
在 屏幕 上 看 到 图 11-1 所 示 的 一 个 空白 窗口 了 。 
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图 11-1 tkinter 空白 窗口 
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前 两 步 比较 好 理解 ,第 三 步 消息 循环 简单 说 就 是 用 来 处 理 窗口 及 内 部 组 件 的 事件 的 。 
鼠标 的 移动 ,键盘 的 按键 . 单 击 按钮 这 些 输入 叫 作 事件 。 比 如 鼠标 移动 事件 , 单 击 事件 、 回 


车 按 下 事件 等 。 图 形 操作 都 是 持续 的 、 动 态 的 , 像 动画 一 样 。 


mainloop 进入 事件 (消息 ) 循 环 。 这 一 步 会 把 控制 权 交 给 GUI ,一旦 检测 到 事件 ,就 刷 
新 组 件 。 比 如 输入 一 个 字符 ,就 要 立即 在 光标 位 置 显示 出 来 (前 提 是 你 选中 了 文本 框 ,也 就 
是 鼠标 在 文本 框 这 个 图 案 的 范围 内 单 击 过 ); 又 比如 单 击 了 一 个 图 形 界面 里 的 按钮 ,就 画 一 


个 五 角 星 。 
1122 添加 组 件 


文本 框 ,按钮 ,标签 等 都 称 为 组 件 (widget), 有 了 空白 窗口 就 可 以 向 窗口 添加 组 件 了 , 比 
如 文字 标签 ,按钮 。 添 加 组 件 需 要 先生 成 组 件 对 象 ,再 通过 pack 方法 添加 至 主 窗口 。 


#tkl.py 

import tkinter 

root =tkinter.Tk() ”<# 生 成 主 窗口 

label = tkinter.Label (root, text= "你 好 ") # 生 成 标签 对 象 
label.pack() # 将 标签 添加 到 主 窗口 

buttonl = tkinter.Button (root，text= "五 角 星 ") # 生 成 按钮 
buttonl.pack() # 将 按钮 添加 到 主 窗口 


root .mainloop () 


运行 后 可 以 看 到 图 11-2 所 示 的 窗口 。 





图 11-2 窗口 组 件 


这 里 我 们 添加 了 两 个 组 件 , 一 个 标签 “你 好 ”, 一 个 按钮 “五 角 星 ”, 因 为 没有 指定 组 件 的 


位 置 ,所 以 tkinter 就 自行 安排 了 。 


(75), 
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112.3 事件 绑 定 


11. 2. 2 小 节 的 例子 如 果 你 写 出 来 ,可 能 会 发 现 , 单 击 “ 五 角 星 ”按钮 没有 任何 反应 。 这 
是 因为 我 们 并 没有 为 单 击 “ 五 角 星 ” 按 钮 这 个 行为 编写 相关 联 的 程序 。 

可 以 针对 具体 事件 编写 对 应 的 处 理 函 数 , 并 通过 bind 方法 与 组 件 进行 绑 定 。 这 样 , 当 
组 件 触发 响应 事件 后 就 会 调用 这 个 函数 ,现在 就 给 “五 角 星 ?按钮 绑 定 一 个 处 理 函 数 。 


#tkf.py 
import tkinter 
import turtle 


root = tkinter.Tk() # 生 成 主 窗口 
label = tkinter.Label (root, text= "你 好 ") # 生 成 标签 


label.pack() 


# 将 标签 添加 至 主 窗口 


buttonl = tkinter.Button (root, text= "五 角 星 ") # 生 成 按钮 


buttonl .pack() # 将 按钮 添加 至 主 窗口 
大 #### 
def wjx (event): # 事 件 响 应 函数 
for i in range(5) : 

turtle.forward(100) 

turtle.right (144) 
提 厅 非 # 
buttonl .bind('<Button-1>',wjx) # 绑 定 事件 
Foot .mainloop () # 进 入 消息 循环 


现在 再 单 击 “ 五 角 星 ”按钮 ,就 会 启动 海龟 绘图 画 五 角 星 了 。 


112.4 其 他 组 件 


tkinter 提供 的 组 件 很 丰富 ,目前 有 十 几 种 tkinter 组 件 ,列举 如 下 。 
Button: 按钮 控件 ,在 程序 中 显示 按钮 。 

Canvas: 画布 控件 ,显示 图 形 元 素 如 线条 或 文本 。 

Checkbutton: 多 选 框 控件 ,用 于 在 程序 中 提供 多 项 选择 框 。 

Entry: 输入 控件 ,用 于 显示 简单 的 文本 内 容 。 

Frame: 框架 控件 ,在 屏幕 上 显示 一 个 矩形 区 域 , 多 用 来 作为 容器 。 
Label: 标签 控件 ,可 以 显示 文本 和 位 图 。 

Listbox: 列表 框 控件 ,在 Listbox 窗口 小 部 件 用 来 显示 一 个 字符 串 列 表 给 用 户 。 
Menubutton: 菜单 按钮 控件 ,用 于 显示 菜单 项 。 

Menu: 菜单 控件 ,显示 菜单 栏 、 下 拉 菜 单 和 弹出 菜单 。 

Message: 消息 控件 ,用 来 显示 多 行文 本 ,与 Label 比较 类 似 。 
Radiobutton: 单 选 按钮 控件 ,显示 一 个 单 选 的 按钮 状态 。 

Scale: 范围 控件 ,显示 一 个 数值 刻度 ,为 输出 限定 数字 区 间 。 

Scrollbar: 滚动 条 控件 , 当 内 容 超过 可 视 化 区 域 时 使 用 ,如 列表 框 。 
Text: 文本 控件 ,用 于 显示 多 行文 本 。 

Toplevel: 容器 控件 ,用 来 提供 一 个 单独 的 对 话 框 ,与 Frame 比较 类 似 。 
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Spinbox: 输入 控件 ,与 Entry 类 似 , 但 是 可 以 指定 输入 范围 值 。 
PanedWindow: 是 一 个 窗口 布局 管理 的 插件 ,可 以 包含 一 个 或 者 多 个 子 控件 。 
LabelFrame: 是 一 个 简单 的 容器 控件 ,常用 于 复杂 的 窗口 布局 。 


tkMessageBox: 用 于 显示 应 用 程序 的 消息 框 。 
11. 2. 3 小 节 的 程序 再 加 上 一 个 菜单 ,程序 如 下 。 


#tkfm.py 
import tkinter 
import turtle 


root = tkinter.Tk() # 生 成 主 窗口 

提 井 棋 并 

menu = tkinter.Menu (root) # 生 成 菜单 

submenu = tkinter .Menu (menu, tearoff = 0) # 生 成 下 拉 菜 单 

submenu.add command (label = "Open") # 向 下 拉 菜 单 添加 指令 名 字 为 open 
submenu.add command (label = "Save") # 向 下 拉 菜 单 添加 指令 名 字 为 Save 


menu.add cascade (label = "File",menu = submenu)  # 将 下 拉 菜 单 添 加 到 菜单 


root .config (menu = menu) 


非 ## 井 提 
label = tkinter.Label (root, text = "你 好 ") # 生 成 标签 
label.pack() # 将 标签 添加 至 主 窗口 
buttonl = tkinter.Button (root, text= "五 角 星 ") # 生 成 按钮 
buttonl .pack () # 将 按钮 添加 至 主 窗口 
大 ### 
def wjx (event): # 事 件 响应 函数 
for i in range(5) : 

turtle.forward(100) 

turtle.right (144) 
拓 ## 大 
buttonl .bind('<Button-1>',wjx) # 绑 定 事 件 
root .mainloop () # 进 入 消息 循环 


运行 程序 可 以 看 到 如 图 11-3 所 示 的 下 拉 菜 单 了 ,但 是 并 没有 绑 定 事件 。 





4 = 口 x 
File | 























11-3 下拉 菜 单 


(> wxPython 


虽然 tkinter 用 起 来 很 方便 ,不 过 只 适合 开发 小 型 应 用 程序 , 若 要 开发 复杂 的 应 用 程序 
就 不 够 用 了 ,这 时 就 需要 考虑 其 他 的 GUI 库 。11. 1. 1 小 节 我 们 也 介绍 了 一 些 ,这 里 以 


A 
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wxPython 为 例 。 

wxPython 不 是 Python 内 置 模块 ,所 以 需要 额外 安装 ( 见 图 11-4) ,最 简单 的 方法 就 是 
通过 pip 安装 ,“-U” 是 表示 升级 ,如 果 有 新 版 本 会 自动 更 新 。 注 意 wxPython 中 的 字母 “P” 
是 大 写 的 。 


加 windowsPowershel = 口 民 











图 11-4 安装 wxPython 


此 外 ,也 可 以 登录 wxPython 的 官方 网 站 下 载 安 装 ,而 且 官 方 网 站 还 有 帮助 和 手册 可 
以 参考 ,地址 是 https://www. wxpython. org/。 
安装 后 可 以 导入 wx 模块 测试 一 下 ,没有 报错 就 可 以 使 用 了 。 


>>>import wx 


人 .34 子 类 化 开发 : 空白 窗口 


在 tkinter 的 例子 中 ,如 果 细 心 观察 可 以 发 现 ,我 们 做 的 很 多 事情 
都 是 在 对 类 实例 化 ,再 通过 对 象 调用 方法 的 形式 进行 程序 设计 。 这 种 
做 法 比较 适合 简单 窗口 的 开发 ,如 果 是 复杂 窗口 ,可 能 要 实例 化 很 多 对 

所 以 ,还 有 一 种 做 法 就 是 通过 继承 相应 的 类 并 进行 重 载 ,把 程序 设 
计 都 放 在 子 类 中 ,这 样 的 程序 模块 化 程度 更 高 ,也 更 灵活 ,这 种 方式 可 
以 称 为 子 类 化 开发 ,在 wxPython 中 可 以 采取 这 种 方式 ,当然 ,tkinter 也 是 可 以 采用 的 。 

通过 一 个 空白 窗口 进入 子 类 化 开发 模式 。GUI 的 开发 大 同 小 异 , 用 wxPython 生成 空 
白 窗口 只 需要 以 下 5 个 步 又。 

(1) 导入 wx 模块 。 

(2) 实例 化 一 个 应 用 程序 对 象 。 

(3) 创建 wx. Frame 主 窗口 对 象 ,其 他 组 件 可 以 加 入 wx. Frame 窗口 中 。 

(4) 通过 Frame 的 show() 方 法 显示 窗 体 。 

(5) 进入 应 用 程序 事件 主 循环 。 

我 们 先 采 用 对 象 化 的 方式 生成 一 个 空白 窗口 ,这样 ,每 个 对 象 起 什么 作用 就 比较 明显 了 。 











子 类 化 开发 : 空 窗口 





#wxpyl .py # 对 象 化 生成 空白 窗口 
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import wx 


app = wx.App () # 应 用 程序 对 象 
frame = wx.Frame (parent = None) # 框 架 窗口 对 象 
frame. Show () # 显 示 框 架 窗口 
apPp.MainLoop () # 进 入 消息 循环 


运行 后 就 可 以 看 到 一 个 空白 窗口 了 ( 见 图 11-5)。 








11-5 “wxPython 空白 窗口 


这 里 可 以 看 到 wx. App、wx. Frame 其 实 都 是 类 ,我 们 可 以 继承 过 来 进行 重 载 ,最 后 再 


实例 化 就 可 以 了 。 下 面 把 工作 简化 ,继承 wx. App 类 进行 重 载 。 


#wxpycl .py 

import wx 

class MyAppP (wx.App): 

def OnInit (self): 

frame = wx .Frame (parent = None) # 生 成 框架 窗口 
frame.Show () # 显 示 框 架 窗口 
return True 

app = MYRAPP () 

apPp.MainLoop () 


可 以 看 出 新 定义 一 个 子 类 继承 wx. App ,在 这 个 类 里 实例 化 了 wx. Frame。 也 可 以 重 


新 加 载 wx. Frame ,我们 先 把 工作 集中 在 一 个 点 上 。 
人 .3.2 添加 组 件 及 窗口 布局 


有 了 空白 窗口 ,就 可 以 添加 组 件 了 。 这 里 有 个 关键 角色 就 是 wx. 
Frame，wx. Frame 是 继承 自 wx. Window 类 的 窗口 类 ,窗口 可 以 指定 
大 小 和 位 置 ,可 以 加 入 标题 .标签 .菜单 .工具 栏 . 状态 栏 等 组 件 。 

先 对 聊天 窗口 添加 组 件 ,并 调整 好 组 件 的 布局 。 


#wxmychat-0.1.py 
import wx 


class MyApp (wx.APP) : 
def OnInit (self): # 重 载 onInit 方法 
# 生 成 frame 框架 对 象 
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frame = wx.Frame (parent = None, 


title = "Milo Chat", 
size= (520,450), 
pos = (800, 300)) 


Panel = wx.Panel (frame -1) 


labelall =wx.StaticText (panel,-1, 


'All Contents', 
pos = (210, 5)) 





# 窗 口 标题 
# 窗 口 尺 十 
# 窗 口 启动 时 在 屏幕 的 位 置 


# 生 成 面板 ,以 便 布 局 管理 
# 标 签 
# 标 签 内 容 


self.textall = wx.TextCtrl(panel,-1，# 文 本 框 


size= (480,200), 
pos = (10,30), 


style = wx.TE READONLY |wx.TE MULTILINE) 


labelin = wx.StaticText (panel,-1,'I Say', 


pos = (230,230)) 


self.textin = wx.TextCtrl (panel,-1, 


size = (480,100), 
pos = (10,260), 


style = wx .TE MULTILINE) 


self.buttonSent = wx.Button (panel,-1,"Sent", # 按 钮 上 的 文字 
size= (75,25),pos = (175, 370) ) 
self.buttonSave = WX.Button (panel,-1,"Save", 
size = (75,25),pos = (260, 370)) 


frame.Show () 
return True 


9 


app = MyApP () 
app.MainLoop() 


程序 运行 后 的 效果 如 图 11-6 所 示 。 





夯 Milo Chat 


All Contents 








1Say 























图 11-6 ”聊天 窗口 
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这 段 代 码 看 起 来 好 像 很 多 ,其 实 只 做 了 两 件 事 , 就 是 添加 组 件 和 布局 管理 ,我 们 来 逐一 
介绍 二 下 。 


1 框架 和 面板 


通过 wx. Frame 生成 了 框架 ,框架 就 是 我 们 说 的 窗 体 ,可 以 在 里 面 添加 组 件 。wx. 
Frame 是 所 有 框架 的 父 类 ,构造 函数 wx. Frame. __init__ 的 作用 主要 是 针对 框架 的 一 些 基 
本 属性 设置 ,可 以 在 子 类 中 直接 调用 ,也 可 以 像 现在 这 样 实例 化 出 来 。 


wx.Frame. init _(parent,id,title,pos,size,style,name) 


参数 说 明 如 下 。 

parent: 框架 父 窗 体 , 作 为 顶级 窗 体 , 值 为 None。 

id: 定义 新 窗 体 的 ID 号 ,如 果 不 指定 可 以 用 一 1。 

title: 窗 体 标题 。 

pos: 指定 窗 体 左上 角 在 屏幕 中 的 位 置 ,(0,0) 代 表 显 示 器 左上 和 角 。 例 子 中 (800,300) 表 
示 距 左 侧 800 像素 , 距 项 部 300 像素 。 

size: 当前 窗 体 的 初始 尺寸 。 

style: 窗 体 的 类 型 。 

name: 框架 名 字 , 如 果 指 定 , 可 以 通过 名 字 找 到 这 个 窗 体 。 

这 个 例子 中 还 有 一 个 wx. Panel( 面 板 ) ,面板 的 作用 是 管理 组 件 的 布局 。 可 以 想象 是 在 
木 框架 上 贴 了 一 张 画布 ,在 画布 上 画 画 。 其 参数 同 wx. Frame. __init__, 因 为 此 例 已 经 在 
Frame 中 全 部 指定 ,所 以 除了 Parent 以 外 ,其 他 都 省 略 了 。 


2. 组 件 


有 了 框架 和 面板 , 接 下 来 就 是 添加 组 件 了 ,依次 添加 了 三 种 组 件 分 别 如 下 。 

wx. StaticText: 静态 文本 框 。 

wx. TextCtrl: 文本 框 。 

wx. Button: 按钮 。 

每 个 组 件 都 有 自己 特定 的 属性 ,具体 可 以 通过 wxPython 的 官方 文档 查阅 。 这 里 所 有 
组 件 的 第 一 个 参数 都 是 parent, 其 实 就 是 组 件 添加 的 面板 ;组 件 的 pos 是 指 组 件 左 上 角 位 于 
面板 中 的 位 置 ,(0,0) 是 面板 的 左上 和 角 ; size 是 组 件 的 大 小 ,比如 按钮 和 文本 框 都 指定 了 
大 小 。 

这 里 的 两 个 文本 框 都 用 style 参数 来 指定 文本 框 的 样式 ,这 个 style 非常 有 用 ,可 以 用 
来 指定 文本 框 是 否 支持 多 行 . 是 否 可 拉 伸 等 。 比 如 wx. TE_MULTILINE 就 表示 这 是 一 个 
支持 多 行 的 文本 框 ,如 果 没 有 这 条 ,那么 文本 框 只 能 输入 或 显示 一 行文 本 。self. textall 对 
象 的 style 除了 多 行 属性 还 指定 了 wx. TE_READONLY (文本 框 只 读 ), 需 要 注意 的 是 ,如 
果 是 多 个 属性 ,需要 用 "|? 隔 开 。 
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11.3.3 事件 绑 定 


事件 绑 定 就 是 在 窗口 内 进行 操作 时 触发 的 函数 ,设计 的 窗口 只 有 
两 个 按钮 : 发 送 消 息 按钮 和 清空 聊天 记录 按钮 。 因 为 现在 还 没有 学 习 
如 何 通 过 网 络 传输 数据 ,所 以 简化 一 下 这 个 例子 ,自己 和 自己 聊天 : 在 
下 面 输入 消息 , 单 击 sent 按钮 后 将 信息 显示 到 上 面 的 聊天 记录 窗口 ， 
单 击 clear 按钮 , 则 清空 聊天 记录 。 

函数 设计 及 绑 定 方式 如 下 : 





Fe 


文本 框 和 聊天 窗口 


#wxmychat-0.2.py 
import wx 
import time 


class MyApP (wx.APP) : 
def OnInit (self) : 
frame = wx.Frame (parent = None, 
title = "Milo Chat", 
size = (520,450), 
pos = (800,300)) 
panel = wx.Panel (frame, -1) 
labelAll =wx.StaticText (panel,-1, 'All Contents', 
pos = (210,5)) 
self.textAll = wx.TextCtr]l (panel,-1, 
size = (480,200), 
pos = (10,30), 
style = wx.TE READONLY |wx.TE MULTILINE) 
labelIn = wx.StaticText (panel,-1, 'I Say', 
pos = (230,230)) 
self.textIn = wx.TextCtrl (panel,-1, 
size = (480,100), 
pos = (10,260), 
style = wx.TE MULTILINE) 
覃 提 排 拓 提 提 提 提 失 提 排 提 提 提 失 提 提 提 捍 提 提 提 提 提 提 提 提 提 提 提 提 提 提 提 提 提 提 拉 提 提 提 提 提 提 捍 提 提 提 提 拉 提 提 提 提 提 提 提 提 提 
self.buttonSent = WX.Button (panel,-1,"Sent", 
size= (75,25),pos = (175,370) ) 
self.Bind (wx.EVT BUTTON, 
self.OnButtonSent,self.buttonSent) 
self.buttonClear =wx.Button (panel, -1, "Clear", 
size = (75,25),pos = (260,370)) 
self.Bind (wx.EVT BUTTON, 
self.OnButtonClear, self.buttonClear) 
提 提 大 失 提 提 提 提 提 提 提 提 提 提 提 提 提 提 提 提 提 提 提 提 提 拉 提 提 提 提 提 提 提 提 提 提 提 提 提 提 提 提 搓 提 提 提 提 提 提 大 提 提 提 提 提 提 并 提 
frame.Show () 
return True 


def OnButtonSent (self,event): 


userinput = self.textin.GetValue() # 获 取 输 入 文本 框 的 数据 
self.textIn.Clear() # 清 空 输入 文本 框 
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nowtime = time.ctime () # 增 加 时 间 
inmsg = "You ($s) :\ngss \n" ss (nowtime,userinput)  # 拼 接 数 据 
self.textRAl11.APPendText (inmsg) # 尾 部 添加 文本 


def OnButtonClear (self,event) : 
self.textAll.Clear () 


if name ==" main ";: 
app = MYRAPP () 
app.MainLoop () 


事件 绑 定 通过 wx. App. Bind, 用 到 了 其 中 三 个 参数 ,Bind( 事 件 类 型 .事件 响应 函数 、 事 
件 源 ) 。 

(1) 事件 类 型 : 几乎 涵盖 了 所 有 窗口 操作 ,我们 用 的 是 按钮 事件 wx.EVT_BUTTON。 

(2) 事件 响应 函数 : 响应 函数 除了 self 参数 外 ,还 需要 第 二 个 参数 接受 一 个 event 对 
象 ,不 同 的 事件 会 接受 不 同 的 event 对 象 。 

(3) 事件 源 : 对 应 的 是 具体 组 件 , 这 里 对 应 的 就 是 按钮 。 

定义 的 事件 响应 函数 要 根据 实际 逻辑 关系 设计 ,比如 sent 按钮 绑 定 的 OnButtonSent。 
通过 调用 输入 文本 框 对 象 self. textin 的 GetValue 方法 ,获取 输入 文本 框 内 的 数据 ;再 调用 
Clear 方 法 清空 输入 文本 框 , 从 视觉 上 好 像 消息 发 走 了 ;然后 再 将 获取 的 数据 进行 处 理 , 比 
如 加 上 发 送 的 时 间 ; 最 后 这 个 消息 输出 到 代表 聊天 记录 的 文本 框 , 而 且 不 能 覆盖 之 前 的 消 
息 ,通过 代表 聊天 记录 的 对 象 self. textall 调用 AppendText 方法 实现 。 

最 后 的 效果 如 图 11-7 所 示 。 
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图 11-7 聊天 记录 


这 样 就 完成 了 一 个 简单 的 聊天 窗口 ,配合 网 络 编程 就 可 以 传输 数据 了 。 
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11.3.4 布局 管理 器 


我 们 完成 了 一 个 聊天 窗口 ,但 是 这 个 窗口 还 有 一 些 问题 ,比如 如 果 
拖 搜 ,缩放 、 拉 伸 它 ( 见 图 11-8), 内 部 组 件 并 不 会 随 着 边框 按 比例 缩放 ， 
这 是 因为 在 定义 组 件 时 ,用 了 固定 尺寸 。 这 种 固定 尺寸 的 形式 对 于 像 
计算 器 那样 大 小 固定 的 软件 比较 有 用 ,但 在 这 里 显然 不 太 合适 ,这 时 我 
们 就 要 了 解 布局 管理 器 了 。 











画 Milo Chat a 口 x 
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图 11-8 聊天 窗口 拉 什 


wxPython 中 ,使 用 wx. BoxSizer 管理 组 件 的 布局 。wx. BoxSizer 将 窗口 中 的 组 件 以 单 
元 格 的 形式 划分 ,将 组 件 放 至 单元 格 中 ,而 不 需要 单独 规定 大 小 ,仅仅 通过 sizer 就 可 以 管理 
添加 在 其 中 的 组 件 布局 位 置 。 

sizer 的 创建 和 使 用 的 步 又 如 下 。 

(1) 创建 sizer 对 象 : 


sizer = wx.BoxSizer (布局 方式 ) 

(2) 将 容器 中 的 子 窗口 添加 到 这 个 sizer: 
sizer.Add (组 件 对 象 ,proportion,flag,border) 
(3) 将 sizer 关联 到 一 个 容器 : 
panel.SetSizer (sizer) 


以 这 个 聊天 窗口 为 例 , 可 以 这 样 划分 ( 见 图 11-9)。 

整体 为 纵向 排列 ,其 中 最 后 一 行为 横向 排列 ,利用 sizer 中 的 纵向 和 横向 划分 就 可 以 了 ， 
代码 如 下 : 

#wxmychat-0.3.py 


import wx 
import time 
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11-9 布局 划分 


class MyFrame (wx.Frame): 
def _ init _(self): 

wx.Frame. init _(self,None,-1,"Milo Chat",size = (520,450)) 
panel = wx.Panel (self) 
labelAll =wx.StaticText (panel,-1,'All Contents') 
self.textAll = wx.TextCtr]l (panel,-1, 

size = (480,200), 

style = wx .TE READONLY|wx.TE MULTILINE) 
labelIn = wx.StaticText (panel,-1, 'I Say') 
self.textIn = wx.TextCtrl (panel,-1, 

size= (480,100), 
style = wx.TE MULTILINE) 

self.btnSent = wx.Button (panel, -1,"Sent", size = (75,25)) 
self.btnClear = wx.Button (panel, -1,"Clear",size = (75,25)) 
self.Bind (wx.EVT BUTTON, self.OnButtonSent, self.btnSent) 
self.Bind (wx.EVT BUTTON, self.OnButtonClear, self .btnClear) 
村 # 布 局 管理 #### 
btnSizer = wx.BoxSizer () # 创 建 横向 管理 器 
btnSizer.Add(self.btnSent,proportion = 0) 
btnSizer.Add(self.btnClear,proportion = 0) 


mainSizer = wx.BoxSizer (wx.VERTICAL) ”<# 创 建 纵向 管理 器 
mainSizer.Add (labelAl]l,proportion = 0,flag = wx.ALIGN CENTER) 
mainSizer.Add (self.textAll,proportion = 1,flag = wx.EXPAND) 
mainSizer.Add (labelIn,proportion = 0,flag = wx.ALIGN CENTER) 
mainSizer.Add (self.textIn,proportion = 0,flag = wx.EXPAND) 
mainSizer.Add (btnSizer,proportion = 0,flag = wx.ALIGN CENTER) 


panel.SetSizer (mainSizer) 
mainSsizer.SetSizeHints (self) # 启 动 组 件 最 小 限制 
排 失 提 划 覃 提 提 提 提 提 并 闪闪 并 间 间 


def OnButtonSent (self,event): 
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userinput = self.textIn.GetValue () 
self.textIn.Clear() 

nowtime = time.ctime () 

inmsg = "You (%s) :\ngss \n" gs (nowtime,userinput) 
self.textAll .AppendText (inmsg) # 尾 部 添加 文本 


def OnButtonClear (self,event): 
self.textAll.Clear () 


if name ==" main ";: 
apP = wx.App () 
frame = MyFrame () 
frame.Show() 
app.MainLoop () 


运行 后 ,可 以 随 边框 拉 伸 ,动态 效果 你 可 以 在 自己 的 计算 机 上 尝试 ( 见 11-10) 。 
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图 11-10 窗口 拉 伸 


在 这 段 代码 中 我 们 做 了 一 些 更 改 , 针 对 这 段 代码 说 明 如 下 。 

(1) 换 了 个 继承 的 类 。 因 为 工作 基本 是 针对 框架 的 ,所 以 直接 继承 wx. Frame 类 进行 
开发 。 当 然 , 用 之 前 的 办 法 也 是 可 以 的 ,这 样 做 只 是 想 在 有 限 的 内 容 编排 下 多 展示 一 些 开 
发 的 方式 。 

(2) 所 有 用 来 指定 组 件 位 置 (pos) 的 参数 都 没有 了 。 其 中 ,框架 、 文 本 框 和 按钮 都 指定 
了 size, 但 由 于 组 件 是 采用 sizer 管理 的 ,所 以 ,这 里 指定 的 size 是 窗口 和 文本 框 的 初始 
尺寸 。 

(3) # 号 标注 的 部 分 就 是 布局 管理 器 ,根据 前 面 布局 分 析 ,将 整个 窗口 看 作 是 纵向 排列 
的 ,其 中 最 后 一 排 是 横向 的 。 所 以 我 们 创建 两 个 布局 ,一 个 横向 的 btnSizer, 添 加 了 两 个 组 
件 ,这 两 个 组 件 在 这 个 管理 器 中 会 以 横向 的 方式 排列 。 再 创建 一 个 纵向 的 mainSizer, 加 入 
其 中 的 组 件 就 会 按 纵向 排列 ,依次 添加 组 件 ,最 后 将 横向 管理 器 作为 一 个 整体 添加 进去 。 

(4) 向 布局 管理 器 添加 组 件 用 sizer. Add (组 件 对 象 , proportion, flag) 方 法 ,其 中 
proportion 参数 定义 了 构件 在 既定 方向 上 所 占 空 间 的 比例 ,是 相对 的 ,相对 于 其 他 组 件 。 
0 表示 不 变 , 比 如 按钮 在 拉 伸 时 不 需要 变 大 。 输 入 文本 框 为 0, 则 在 其 布局 管理 器 的 方向 拉 


@ 
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伸 时 不 会 有 变化 ,本 例 中 上 、 下 拉 伸 时 输入 文本 框 就 不 会 纵向 拉 伸 。 而 聊天 记录 文本 框 的 
值 为 1, 则 在 纵向 拉 伸 时 会 随 着 变化 。flag 则 在 布局 的 控制 上 加 入 了 更 多 可 能 ,本 例 中 用 了 
wx. ALIGN_CENTER( 居 中 ) 和 wx. EXPAND( 组 件 使 用 所 有 分 配给 它 的 空间 ) 。 

(5) panel. SetSizer(mainSizer) 用 来 设置 面板 采用 哪个 布局 管理 器 。 因 为 我 们 把 按钮 
的 sizer 添加 到 了 mainSizer 中 ,所 以 ,只 需 绑 定 mainSizer 就 可 以 了 。 

(6) 最 后 mainSizer. SetSizeHints(self) 的 作用 是 防止 窗口 过 度 缩小 ,启动 组 件 最 小 限 
制 为 初始 的 size 值 。 

wxPython 提供 了 非常 丰富 的 布局 ,可 以 用 来 制作 复杂 的 界面 。 万事 开头 难 ,掌握 了 基 
本 原理 ,你 就 可 以 通过 手册 或 者 相关 资料 进行 复杂 界面 的 开发 了 。 推 荐 参考 《wxPython in 
Action》 中 文 版 。 


GUI 可 视 化 构建 工具 : 用 wxFormBuilder 开发 GUI 程序 


掌握 了 GUI 编程 的 基本 原理 ,你 可 能 会 发 现 , 如 果 要 开发 一 个 复杂 的 界面 就 意味 着 要 
写 大 量 的 代码 。 手 动用 代码 创建 好 看 的 GUI 是 很 痛苦 的 ,一 个 可 视 化 GUI 工具 会 帮 你 减 
少 这 种 痛苦 。 支 持 wxPython 的 GUI 工具 有 很 多 : wxFormBuilder;wxDesigner; wxGlade; 
BoaConstructor; gui2py。 

但 是 有 些 版 本 已 经 很 久 不 更 新 了 ,也 不 支持 Python 3, 如 果 有 需要 ,最 好 选择 一 个 仍然 
持续 更 新 的 版 本 ,下 面 我 们 以 wxFormBuilder 为 例 介 绍 可 视 化 工具 。 

wxFormBuilder 是 一 个 支持 多 种 程序 语言 的 GUI 构建 工具 ,下 载 地 址 为 https:// 
sourceforge. net/projects/wxformbuilder/? source 王 typ_redirect, 最 近 的 版 本 是 2016 年 
9 月 23 日 更 新 的 。 这 里 我 下 载 的 是 Windows 的 . exe 版 ,正常 安装 就 可 以 了 。 

启动 后 的 软件 界面 如 图 11-11 所 示 。 


untitled - wxFormBuilder v3.5 - RC1 一 [nl x 
Eile Edit View Iools Help 


站 名 回 | | 总 杞 自 %| 尝 | 届 虽 一 | 而 二 | 江 名 || 


MyProject1 : Project 


































embedded fires 
file 
relative_path 区 
first id 1000 

code genera C++ 2 





























Code Generated! Name: MyProject1 | Class: Project 





11-11 wxFormBuilder 
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在 右 侧 的 ObjectProperties 子 窗口 中 对 项 目 做 基本 设置 ( 见 图 11-12) ,比如 项 目的 名 字 
(Cname)、 保 存 的 路 径 Cpath) ,记得 选择 Python 作为 代码 生成 语言 (code_generation) 。 


| 本 Properies SEvens | | 


MychatwWFB 
p ‘CAUsers\milo\Desktop\G 
embedded files path res 
file 








relative_path 





firstid 
日 code_generation 











internationalize 



























图 11-12 基本 项 目 信 息 


以 聊天 窗口 为 例 , 对 应 地 看 一 下 如 何 用 wxFormBuilder 进行 开发 。 注 意图 11-13 中 的 
箭头 位 置 。 


1. 生成 空白 窗口 


依次 单 击 Forms( 箭 头 1)、Frame( 箭 头 2) 按 钮 生成 空白 窗口 3, 可 以 在 右 侧 的 Object 
Properties 子 窗口 中 对 空白 窗口 做 相应 设置 ,比如 title( 箭 头 4)( 见 图 11-13) 。 


























= 
| psagner BBcrr = Python | 局 BPropertes TEvens | | 
-|alx| 
MyFrame2 
tide | 
加 :ye wxDEFAULT_ FRAME _STYLE 








center woBoTH 
xrc_skip_sizer 
event handler implvirtual 
aui managed 口 
EB aui_manager style WxAUI_MGR_DEFAULT 





v 





























图 11-13 ”空白 窗口 
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2. 布局 管理 
通过 Layout( 箭 头 1) 添 加 Sizer( 箭 头 2) 进 行 布局 管理 ,生成 子 目录 (箭头 3) ,选择 纵向 


(箭头 4)( 见 图 11-14) 。 











! Containers | 时 Menu/Tcolbar | 目 Layout DForms | 三 Ribbon 








fyChatWFB :Project 名 Common | 诗 Additional 目 Dats 
MyFrame2 :Frame 瑟 回 
目 bsizer :woBoxsizer 二 


四 


| SDesigrer Bcr+ | = Pymon |® | 可 Prepsrties | 9 Events 











间 





minimum_size 
Width 
Height 














图 11-14 增加 Sizer 


3. 添加 组 件 

首先 注意 最 后 一 行 是 两 个 横向 按钮 ( 见 图 11-15) ,需要 按照 布局 管理 的 操作 ( 见 
11-14) , 先 添 加 一 个 布局 管理 (箭头 1) 并 且 在 Object Properties 子 窗口 中 将 orient 选项 
设置 为 wxHORIZONTAL (表示 横向 排列 ), 然 后 选择 该 布局 管理 器 (箭头 1), 再 在 
Common 中 找到 所 需要 的 组 件 依次 单 击 添加 ,如 在 这 个 新 的 布局 中 添加 OK 按钮 (箭头 2)， 


如 图 11-15 所 示 。 


日 | 万 MyChatWF8 : Project 
日 局 MyFrame2 :Frame 
白 - 目 bsizer1 : wxB8oxSizer 
ae mM_staticText3 : wxStaticText 
EO m_textCtrl3 : wxTextCtrl 
ae m_staticText4 : wxStaticText 
ED m_textCtrl4: wxTextCtrl 
白 - 目 bsizer6 : wxBoxsizer 


-四 m_button4: wxButton 
一 CD m_button5 : wxButton 


1 





























图 11-15 添加 组 件 
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4. 设置 组 件 属性 


所 有 窗口 包括 组 件 属 性 都 在 单 击 选择 后 , 均 可 在 其 对 应 的 Object Properties 中 找 对 应 
的 属性 进行 设置 ( 见 图 11-16) ,以 聊天 记录 文本 框 为 例 , 单 击 allText:wxTextCtrl( 箭 头 1) 
目录 可 对 文本 框 (箭头 2) 进 行 设 置 ,所 有 设置 内 容 在 右 侧 Object Properties 窗口 都 会 显示 ， 
如 右 侧 窗口 4 个 箭头 所 指 的 就 是 我 们 在 编码 阶段 设置 的 一 些 属性 。 








hatWFB : Project 本 Common | 层 Additional | 日 Data | |! Containers | 锋 Menu/Toolbar 
lyFrame2 : Frame 避 0 

目 bsizer1 : wxBoxSizer > 
she mM_staticText3 : wxStatic1 


GE ||| Designer 


1 ta 
1 textin : wxTextCtrl 
= bsizer6 : wxBoxSizer > allText 
EE btnSent : wxButton mu WTE_MULTILINE 
EE btnClear : wxButton 






















































The item willbe expanded to fill the space assigned 
to the item. 








人 E> 


he item will be exp. 于 Name: allText | Class: wxTextCtrl 








图 11-16 对象 属性 设置 


5. 事件 绑 定 


选择 要 触发 事件 的 组 件 ( 箭 头 1) ,然后 单 击 Events 对 其 进行 函数 绑 定 (箭头 2) ,不 同 的 
组 件 会 有 不 同 的 事件 触发 机 制 ,在 这 里 按钮 就 是 OnButtonClick( 箭 头 3) ,后 面 的 文本 框 中 
输入 你 要 定义 的 响应 函数 的 名 字 , 如 图 11-17 所 示 。 

到 这 里 ,工具 能 做 的 事情 就 介绍 完了 , 接 下 来 响应 函数 的 逻辑 代码 需要 你 自己 来 写 了 。 
刚刚 建立 起 来 的 框架 ,只 要 单 击 Editor 子 窗 口中 的 Python 标签 就 能 看 到 代码 了 ,但 是 不 能 
在 这 里 直接 编辑 ,可 以 把 代码 复制 后 保存 到 一 个 Python 脚本 中 。 也 可 以 直接 将 现在 这 个 
项 目 保存 下 来 , 按 F8 键 可 以 直接 生成 代码 文件 。 找 到 刚刚 绑 定 事件 时 生成 的 响应 函数 , 然 
后 编写 实现 的 方法 即 可 。 

F8 默认 生成 的 文件 名 是 noname. py, 位 于 开始 时 我 们 设置 的 项 目 路 径 中 。 打 开 后 就 是 
下 面 这 个 代码 ,没有 重新 排版 。 在 此 ,我 新 导入 了 一 个 time 模块 ,在 OnButtonSent 中 编写 
了 响应 代码 ,如 果 你 也 动手 编写 了 ,在 原 代码 块 中 需要 注意 缩 进 问题 ,默认 生成 的 是 Tab 缩 
进 , 我 们 之 前 的 习惯 都 是 4 个 空格 。 最 后 编 好 逻辑 代码 直接 运行 就 可 以 了 , 跟 手 写 的 代码 是 
一 样 的 效果 。 


© 
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ia orevvonsene 














|onguttonGlick 
|Processa 
|wxEVT_COMMAND _ BUTTON_CUICKED event, 








图 11-17 ” 绑 定 按钮 事件 
#=- -coding: utf-8-#*- 


排 提 扩 提 拉 提 提 提 提 拓 提 提 失 拉 提 提 失 失 提 拉 拉 提 提 提 失掉 提 失 撞 拓扑 失 扩 提 拉 拉 提 提 提 提 提 提 失 提 提 提 失 拉 提 入 提 提 提 拉 扩 拉夫 失 提 提 提 拉 提 提 拉 提 提 提 提 六 提 提 并 提 间 
##Python code generated with wxFormBuilder (version Jun 17 2015) 
##http://www.wxformbuilder.org/ 

## 

## PLEASE DO "NOT" EDIT THIS FILE! 

排 提 扩 提 扩 扩 提 提 提 失 提 提 术 提 提 提 提 扩 提 拉 提 提 提 提 失 提 提 扩 提 提 提 闪失 提 扩 提 提 提 提 提 提 失 提 提 提 提 失 提 扩 提 提 提 拉 拉 提 提 提 提 提 提 拉 提 拉 拉 提 提 提 提 扩 提 提 并 间 间 


import wx 
import wx .xrc 
import time #new 


失 失 拉 提 提 提 提 提 间 失 失 失 失 失 拉 失 失 提 提 提 提 提 提 提 提 拉 提 拉 提 提 拉 提 提 提 提 提 提 提 提 提 提 提 提 提 提 提 提 提 提 提 提 提 提 提 提 提 提 提 提 提 提 提 提 提 
Class MyFrame2 
失 失 拉 大林 提 提 提 提 失 检 失 检 失 拉 失 拉 提 提 提 提 提 提 提 提 拉 提 提 提 提 提 拉 提 提 提 提 提 提 术科 提 提 提 提 提 提 提 提 提 提 提 提 提 提 拉 提 提 提 提 提 提 提 提 提 提 
class MyFrame2 (wx.Frame): 
def init _(self, parent): 
wx.Frame. init _ (self, parent, id = wx.ID ANY, title =u"Milo Chat", pos = 
wx.DefaultPosition, size = wx.Size (412, 325), style = wx.DEFAULT FRAME STYLE |wx.'TAB_ 
TRAVERSAL) 
self.SetSizeHintsSz (wx.DefaultSize, wx.DefaultSize) 


bSizerl = wx.BoxSizer (wx.VERTICAL) 


self.m staticText3 = wx.StaticText (self, wx.ID ANY, u"All Aontents", wx. 


DefaultPosition, wx.DefaultSize, wx.ALIGN CENTRE) 
(091 》 
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self.m _ staticText3.Wrap (-1) 
bsSizerl.Add(self.m _ staticText3，0，wx .EXPRND，5) 


self.allText =wx.TextCtrl(self, wx. ID _ ANY, wx. EmptyString, wx. 


DefaultPosition, wx.DefaultSize, wx.TE MULTILINE) 
bsSizerl.Add(self.allText, 1, wx.EXPAND, 5) 


self.m staticText4 =wx.StaticText (self, wx. ID __ ANY, u" I SAY", wx. 
DefaultPosition, wx.DefaultSize, wx.ALIGN CENTRE) 

self.m staticText4.Wrap(-1) 

bsSizerl.Add(self.m staticText4, 0, wx.EXPAND, 5) 


self.textIn =wx.TextCtrl(self, wx. ID _ ANY, Wx. EmptyString, wx. 
DefaultPosition, wx.DefaultSize, wx.TE MULTILINE) 
bsSizerl.Add(self.textIn, 0, wx.EXPAND, 5) 


bSizer6 = wx.BoxSizer (wx.HORIZONTAL) 


self.btnSent =wx.Button(self, wx.ID ANY, u"Sent", wx.DefaultPosition, wx. 
DefaultSize, 0) 
bsSizer6.Add(self.btnSent, 0, wx.ALL, 5) 


self.btnClear = wx.Button (self, wx.ID ANY, u"Clear", wx.DefaultPosition, 
wx.DefaultSize, 0) 
bsSizer6.Add(self.btnClear, 0, wx.ALL, 5) 


bsSizerl.Add(bSizer6, 1, wx.ALIGN CENTER HORIZONTAL, 5) 


self.SetSizer (bSizerl 
self.Layout () 


self.Centre (wx .BOTH) 


#Connect Events 
self.btnSent .Bind (wx.EVT BUTTON, self.OnButtonSent) 
self.btnClear.Bind (wx.EVT BUTTON, self.OnButtonClear) 


def del _(self): 
pass 


#Virtual event handlers, overide them in your derived class 
def OnButtonSent (self, event): 

event .Skip() 

de 

userinput = self .textIn.GetValue() 

self.textIn.Clear() 

nowtime = time.ctime () 

inmsg = "You ($s) :\nss \n" gs (nowtime,userinput) 

self.allText .AppendText (inmsg) 


© 
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def OnButtonClear (self, event): 
event .Skip() 


if _name _==" main ": 
app =wx.APP() 
frame = MyFrame2 (None) 
frame.Show() 
app.MainLoop() 


> 有 LE 生成 可 执行 的 二 进 制 文件 


现在 ,你 已 经 编写 了 一 个 带 图 形 化 用 户 界面 的 软件 。 那 么 , 接 下 来 
是 不 是 就 要 分 发 给 其 他 人 用 了 呢 ? 如 果 你 已 经 迫不及待 地 用 U 盘 
copy 到 了 其 他 人 的 计算 机 上 ,可 能 会 让 你 失望 ,因为 有 可 能 其 他 人 的 
计算 机 上 并 没有 Python 的 运行 环境 ,怎么 办 ? 给 他 安装 Python 环境 
然后 再 运行 ? 

如 果 想 在 没有 Python 环境 的 计算 机 中 运行 Python 脚本 ,可 以 将 
Python 脚本 打包 封装 成 Windows 可 执行 文件 ,就 可 以 双击 直接 运行 了 。 

用 来 打包 生成 可 执行 文件 的 工具 很 多 ,比如 py2exe、pyinstaller、cx_freeze, 不 一 定 哪 个 
对 你 的 版 本 支持 得 最 好 ,所 以 有 时 候 需 要 你 多 试 试 。 这 里 我 们 用 pyinstaller。 

安装 pyinstaller 的 方法 如 下 。 

pyinstaller 的 官方 网 站 http://www. pyinstaller. org 有 详细 的 说 明和 手册 ,安装 比较 
简单 ,可 以 直接 用 pip install pyinstaller 安装 升级 ( 见 图 11-18) 。 




















图 11-18 ”安装 pyinstaller 


安装 后 切换 到 脚本 所 在 目录 (cd) ,执行 pyinstaller -F noname. py 命令 就 可 以 生成 可 执 
行文 件 了 ( 见 图 11-19),F 选项 的 作用 是 生成 一 个 可 执行 文件 ,如 果 不 加 ,会 生成 一 堆 零散 


(ss 
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加 命令 提示 符 - ODO x 
~ 
lero\code\11\build\noname\out00-PYZ.pyz completed successfully. 
17263 INFO: checking PKG 

Building PKG because out99-PKG.toc is non existent 

Building PKG (CArchive) out69-PKG.pk9 

Building PKG (CArchive) out69-PKG.pk9 completed successfully. 

: Bootloader c:\users\milo\appdata\local\programs\python\python36-32\ 

lib\site-packages\PyInstaller\bootloader\dindows-32bit\run.exe 
|23691 INF0: checking EXE 
23691 INFO: Building EXE because out99-EXE.toc is non existent 
23692 INF0: Building EXE from out99-EXE.toc 
23692 INF0: Appending archiue to EXE C:\Users\milo\Desktop\CrazyPythonzeroToHer 
lo\code\11\dist\noname .exe 
23712 INF0: Building EXE from out99-EXE.toc completed successfully. 


IC:\Users\milo\Desktop\CrazyPythonZeroToHero\code\11>pyinstaller -F noname.py 





图 11-19 生成 一 个 可 执行 文件 


文 标 < 
成 功 后 会 生成 一 个 dist 目录 ,里 面 的 noname. exe 就 是 可 以 双击 运行 的 可 执行 文件 了 
( 见 图 11-20) 。 




















v CrazyPythonZeroTot 仿 名 称 
~ 
国 noname.exe 

1 

>6 
7 

>》 时 8 
10 

v 看 11 














图 11-20 可 执行 文件 
如 果 你 有 . ico 类 型 的 图 标 文件 ,还 可 以 拿 来 生成 个 性 图 标的 可 执行 文件 。 怎 么 做 ? 请 
自己 动手 查 手册 。 
硬 重点 提示 


在 这 一 章 中 ,你 要 掌握 的 内 容 : 
(1) 理解 GUI 编程 中 的 窗口 、 事 件 、 组 件 等 概念 。 
(2) 掌握 wxPython 的 子 类 化 开发 模式 。 


/ 动 动手 
(1) 实现 一 个 简易 的 记事 本 , 带 有 打开 和 保存 功能 。 


(2) 做 一 个 简易 计算 器 ,布局 要 求 除了 0 一 9 十 个 数字 按键 还 要 包含 小 数 点 以 及 加 、 
乘 、 除 和 等 号 ,一 共 16 个 按键 ,合理 设计 布局 。 最 后 生成 可 执行 的 . exe 程序 。 
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Python 玩 转 数据 库 


开发 应 用 软件 或 网 站 时 ,大 部 分 情况 都 会 用 到 数据 库存 储 和 管理 数据 。 数 据 库 并 不 是 
Python 自身 特有 的 ,数据 库 在 计算 机 领域 是 一 个 独立 的 存在 ,而 且 有 很 多 公司 、 机 构 开 发 的 
不 同 版 本 。 


(> 有 PA 由 数据 库 初 始 


数据 库 按 数 据 存储 方式 区 分 ,目前 用 到 最 多 的 就 是 关系 型 数据 库 和 非 关 系 型 数据 库 。 

关系 型 数据 库 用 一 句 话 概括 ,就 是 数据 存储 的 方式 像 列表 一 样 , 按 一 定 的 结构 关系 
存 取 数据 。 主 流 的 关系 型 数据 库 如 SQLite、MySQL、Oracle、Access。 昌 然 数据 库 的 版 本 
不 同 ,但 针对 数据 库 的 操作 主要 就 是 数据 的 增 \、 删 、 改 、 查 ,而 且 有 一 套 通 用 的 、 成 熟 的 语 
句 可 以 用 在 不 同 版 本 的 数据 库 上 , 叫 作 SQL, 即 结构 化 查询 语言 (Structured Query 
Language) 。 

Python 对 关系 型 数据 库 都 提供 了 标准 数据 库 接口 Python DB-API。Python DB-API 
为 开发 人 员 提 供 了 数据 库 应 用 编程 接口 ,不 同 的 数据 库 需 要 下 载 不 同 的 DB-API 模块 ,例如 
你 需要 访问 Oracle 数据 库 和 MySQL 数据 ,就 需要 下 载 Oracle 和 MySQL 数据 库 模 块 。 可 
以 在 https://wiki. python. org/moin/DatabaseInterfaces 查看 详细 的 支持 数据 库 列 表 以 及 
相应 的 模块 。 

DB-API 是 一 个 规范 , 它 定义 了 一 系列 必需 的 对 象 和 数据 库存 取 方式 , 以 便 为 各 种 各 样 
的 底层 数据 库 系 统 和 多 种 多 样 的 数据 库 接口 程序 提供 一 致 的 访问 接口 。 使 用 它 连接 各 数 
据 库 后 ,就 可 以 用 相同 的 方式 操作 各 数据 库 。Python DB-API 使 用 流程 如 下 。 

(1) 引入 DB-API 模块 。 

(2) 获取 与 数据 库 的 连接 。 

(3) 执行 SQL 语句 和 存储 过 程 。 

(4) 关闭 数据 库 连接 。 

相对 于 关系 型 数据 库 的 就 是 非 关 系 型 数据 库 NoSQL。NoSQL 数据 库 的 产生 就 是 为 了 
解决 大 规模 数据 集合 多 重 数据 种 类 带 来 的 挑战 ,尤其 是 大 数据 应 用 难题 。 

因为 过 多 的 数据 库 探讨 已 经 超过 本 书 的 范围 ,比如 MySQL 就 够 写 一 本 书 了 ,所 以 这 里 
通过 两 个 有 代表 性 的 关系 型 数据 库 , 来 学 习 一 下 Python 如 何 使 用 数据 库 。 
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SQLite 数据 库 


SQLite 是 一 款 非 常 流行 的 关系 型 数据 库 , 由 于 它 非 常 轻盈 ,因此 
被 大 量 应 用 程序 广泛 使 用 。 最 主要 的 是 SQLite 内 嵌 在 Python 中 ,不 
必 额 外 安装 。 要 使 用 SQLite 只 需要 导入 Python 标准 发 行 版 中 自 带 的 
模块 sqlite3 就 可 以 了 。SQLite 数据 库 既 可 以 直接 保存 到 文件 中 ,也 可 
以 保存 到 内 存 中 。 

要 开发 基于 数据 库 的 程序 ,需要 先 掌 握 数 据 库 的 一 些 基 本 知识 。 
SQLite 属于 关系 型 数据 库 ,你 可 以 将 数据 库 联想 成 存储 数据 的 表格 ,数据库 的 基本 操作 包 
括 创 建 一 个 数据 库 、 创 建 表 、 增 加 (插入 ) 记 录 、 删 除 记 录 、 修 改 记 录 以 及 查询 记录 。 数 据 库 
的 这 些 操 作 都 是 通过 SQL 语句 实现 的 ,下 面 的 例子 中 主要 SQL 语句 如 下 。 

(1) 创建 数据 库 
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create database 库 名 

(2) 创建 表 

create table 表 名 (字段 名 字段 选项 [, 字 段 名 字段 选项 …]) 
(3) 删除 表 

drop table 表 名 

(4) 插入 记录 

insert into 表 名 [字段 名 列表 ] values( 值 列表 ) 

(5) 删除 记录 

delete from 表 名 where 删除 条 件 

(6) 修改 记录 

update 表 名 set 字段 名 = 值 [, 字段 名 = 值 .…] where 修改 条 件 
(7) 查询 表 所 有 记录 

Select * from 表 名 


这 些 都 是 在 数据 库 中 使 用 的 标准 SQL 语句 ,下 面 直 接 通 过 sqlite3 看 一 下 Python 如 何 

sqlite3 基本 操作 如 下 所 述 。 

首先 需要 导入 模块 并 创建 连接 对 象 ,创建 连接 对 象 有 点 像 文件 操作 ,这 时 只 是 建立 了 
与 数据 库 的 一 个 通道 ,返回 的 是 一 个 数据 库 连 接 对 象 。 数 据 库 文件 如 果 存 在 , 则 直接 打开 ; 
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不 存在 , 则 直接 创建 。 


>>> import sqlite3 

>>>conn = sqlite3.connect ('hero.db') 

>>>import os 

>>>o0s.getcwd() 
'C:\\Users\\milo\\AppData\\Local\\Programs\\Python\\Python36- 32' 
>>>0s.1listdir () 

['hero.db'] 


连接 对 象 的 几 个 主要 方法 如 下 。 

execute(SQL 语句 ): 执行 SQL 语句 。 

cursor(): 创建 一 个 游标 。 

commit() : 事务 提交 。 

rollback() : 事务 回 滚 。 

close() : 关闭 数据 库 连 接 。 

创建 了 数据 库 连接 后 , 接 下 来 需要 通过 连接 对 象 的 cursor 方法 创建 一 个 游标 对 象 。 游 
标 对 象 对 表 中 数据 的 检索 提供 了 灵活 的 方法 ,可 以 通过 游标 对 象 的 execute 方法 执行 SQL 
语句 ,实现 增删 \ 改 的 操作 ,通过 fetchall() 和 fetchon() 返 回 查 询 结果 。 

在 刚才 创建 的 hero 库 中 创建 表格 player, 并 插入 4 条 数据 。 记 得 提交 事务 ,否则 数据 
库 不 会 同步 。 


>>>cur = conn.cursor () 

>>>cur.execute ("create table player (name VARCHAR (30), age INT, sex CHAR(1))") 
# 创 建 表 

<sqlite3.Cursor object at 0x05974960> 

>>>CUr .execute ("insert into Player VALUES ('milo', 18, 'M')") 

<sqlite3.Cursor object at 0x05974960> 

>>>CuUr .execute ("insert into Player VALUES ('zou', 20, 'M')") 

<sqlite3.Cursor object at 0x05974960> 

>>> CuUr .execute ("insert into player VALUES ('gqi', 21, 'F')") 

<sqlite3.Cursor object at 0x05974960> 

>>> CUr .execute ("insert into player VALUES ('xian’', 21, 'F')") 

<sqlite3.Cursor object at 0x05974960> 

>>>conn .commit () # 提 交 事 务 相 当 于 将 SoL 语句 传 给 数据 库 执行 


这 里 创建 表 的 SQL 语句 的 意思 是 创建 一 个 名 为 player 的 表 , 有 name、age、sex 三 个 字 
段 ,每 个 字段 的 保存 类 型 分 别 是 VARCHAR(30)( 最 长 30 的 可 变 长 度 字符 串 ) INT( 整 数 ) 
和 CHAR(1)( 固 定 以 为 字符 ) 。 


create table player (name VARCHAR (30), age INT,sex CHRAR (1) ) 


有 了 数据 就 可 以 进行 修改 、 删 除 和 查询 操作 了 。 我 们 修改 milo 的 年 龄 为 19, 删 除 zou 
的 记录 ,分 两 种 方式 查询 数据 库 数据 。 


>>>cur.execute ("update player set age= 19 where name= 'milo'") 
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<sqlite3.Cursor object at 0x05974960> 

>>> CUr .execute ("delete from player where name = 'zou'") 
<sqlite3.Cursor object at 0x05974960> 

>>> CUr .execute("Sselect * from player") # 执 行 查询 命令 
<sqlite3.Cursor object at 0x05974960> 

>>>one = cur .fetchone () # 获 得 一 条 数据 
>>>print (one) 

('milo', 19, 'M') 

>>>all = cur.fetchall () # 获 得 多 条 数据 
>>>print (all) 

ai 2 SE (lan rr ZL 本 条 


需要 注意 的 是 ,执行 过 查询 命令 后 返回 的 不 是 数据 库 的 数据 ,而 只 是 一 个 游标 对 象 , 需 
要 在 调用 游标 对 象 的 fetchone 和 fetchall 来 获取 数据 。 

最 后 需要 关闭 游标 .关闭 数据 库 连 接 , 这 就 像 文件 连接 一 样 ,数据 库 用 过 之 后 也 需要 关 
闭 , 先 关 游 标 再 关 数 据 库 。 


>>>cur.close() 
>>>conn.close () 


SQLite 基本 可 以 满足 现 阶 段 一 般 的 开发 需求 了 ,对 于 其 他 数据 库 , 用 Python 模块 操作 
也 非常 方便 ,只 不 过 ,数据 库 的 学 习 成 本 会 比较 高 。 接 下 来 我 们 直接 用 SQLite 的 例子 来 看 
一 下 在 其 他 数据 库 上 的 操作 过 程 。 


Python 连接 MySQL 


MySQL 是 最 流行 的 关系 型 数据 库 管理 系统 ,在 Web 应 用 方面 
MySQL 是 最 好 的 关系 数据 库 管理 系统 应 用 软件 之 一 。 

与 SQLite 不 同 ,MySQL 是 以 C/S( 客 户 端 /服务 端 ) 的 结构 来 实现 
的 ,需要 安装 服务 端 和 客户 端 软件 。 服 务 端 有 一 个 守护 进程 保证 
MySQL 处 于 运行 状态 ,客户 端 则 通过 指定 主机 、 用 户 名 和 密码 的 方式 
连接 到 服务 端 进行 操作 。 客 户 端 可 以 通过 终端 访问 ,也 可 以 通过 图 形 ”下 转 数据 库 
工具 管理 MySQL-Python 

我 们 不 对 MySQL 做 过 多 介绍 ,直接 来 看 如 何在 Python 中 操作 。 首 先 确 保 MySQL 守 
护 进程 已 经 启动 ,然后 安装 模块 开始 操作 ,Python 3 中 安装 PyMySQL, Python 2 中 安装 
MySQLadb( 具 体 使 用 是 一 样 的 ,只 是 模块 名 字 不 一 样 ) 。 

通过 pip 安装 PyMySQL( 见 图 12-1) 。 

安装 完成 后 可 以 在 PythonShell 中 导入 模块 试 一 下 ,没有 报错 就 是 成 功 了 。 





>>> import pymysql 


在 确保 MySQL 已 经 正常 启动 且 可 用 的 状态 下 ,我 们 来 看 一 下 跟 SQLite 例子 相同 的 操 
作 在 MySQL 中 怎样 实现 。 


@ 
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国 命令 提示 符 天 口 x 
理 文件 


C:\UsersNmiloN\Desktop\CrazypythonzeroToHeroNcode\11>pip instal1 PdMySOL 
[Collecting PuMJSOL 
Dounloadin9 https://files.pythonhosted.org/packages/e5/67/c9f249aagb7b9517b58 

43eeab689b9ccc6a6bb9536fc9d95e65991e6f2ac/PUMHJSOL-6.8.9-py2.py3-none-any.uhl (8 

3k6) 
36% 1 39kB 207kB/s eta 0:00:01 
49% 1 49kB 181kB/s eta 0:0 
61% 1 SIkB 218kB/s eta 
73% 1 61kB 257kB/s 
86% |_ 71kB 285 
98X 
199X | 

B 315kB/s 



















































































图 12-1 安装 PyMySQL 


#pymysql eg.py 
import pymysql 
conn = pymysql.connect (host = "localhost",#MySQL 服务 端 地 址 


user = "root", # 登 录 MysQ1 的 用 户 名 
password = "123456", # 密 码 
db = "hero") # 要 连接 的 库 名 
cur = conn .cursor () # 创建 游标 
SqlCT = "create table player (name VARCHAR(30), age INT, sex CHRR (1) ) " 
CU .execute (Sql1CT) # 创 建 表 


CuUr .execute ("insert into player VALUES ('milo', 18, 'M')") 
cur.execute ("insert into player VALUES ('zou', 20, 'M')") 
nsert into player VALUES ('qgi', 21, 'F')") 
cur.execute ("insert into player VALUES ('xian', 21, 'F')") 


cur.execute 


conn.commit () # 事 务 提交 

cur.execute ("update player set age= 19 where name = 'milo'") 并 修改 数据 
cur.execute ("delete from player where name = 'zou'") # 删 除数 据 
cur.execute ("select * from player") # 执 行 查询 命令 

one = cur.fetchone() # 获 得 一 条 数据 

all = cur.fetchall () # 获 得 多 条 数据 

Print (one) 

print (all) 

cur.close () # 关 闭 游 标 

conn.close() # 关 闭 数据 库 连 接 


有 看 出 异同 吗 ? 除了 模块 不 同 ,名 字 不 同 ,以 及 连接 数据 库 时 指定 了 主机 名 、 用 户 名 、 
密码 等 之 外 ,所 有 的 操作 都 是 一 样 的 ,这 也 是 标准 数据 库 接口 (Python DB-API) 的 好 处 , 换 
了 数据 库 只 需要 更 改 模块 或 者 做 少量 更 改 就 可 以 了 。 

针对 数据 库 的 操作 还 有 很 多 便捷 的 方法 ,掌握 了 基本 原理 后 ,在 工作 中 摸索 出 适合 你 


生产 环境 的 工具 就 好 了 。 
3 














[ 呈 重点 提示 


在 这 一 章 中 ,你 要 掌握 的 内 容 : 

(1) 掌握 基本 的 SQL 语句 ,会 进行 基本 的 增删 改 查 操作 。 

(2) 熟悉 Python 操作 数据 库 的 方式 。 
7 动 动手 

(1) 执行 第 12.2 节 SQLite 的 所 有 操作 。 

(2) 编写 Console 下 的 信息 管理 系统 (可 以 是 各 种 信息 ,比如 图 书 、 商 品 等 )。 建 议 及 要 
求 如 下 。 

@ 可 以 写 一 个 员工 信息 管理 系统 。 

@ 程序 需要 具备 数据 增 、 删 、 改 、 查 功能 ,增删 、 改 、 查 四 项 功能 要 写成 四 个 函数 。 

@ 有 四 个 字段 ,员工 的 名 字 、 性 别 、 年 龄 .电话 ,存储 形式 采用 sqlite3。 

@ 存储 结构 自行 设计 。 

@@ 不 要 赶 工期 ,代码 要 做 到 简洁 优美, 规范、 注释 到 位 。 

@ 也 可 自行 设计 类 似 的 软件 ,功能 不 少 于 以 上 所 涉及 的 内 容 。 

(3) 给 题 (2) 中 的 信息 管理 系统 做 一 个 GUI。 
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第 13 对 
”分 身 有 术 : 多 线程 编程 


随 着 计算 机 硬件 的 发 展 , 计 算 能 力 越 来 越 强 , 程 序 运行 也 越 来 越 快 。 现 代 操作 系统 都 
是 支持 “多 任务 ”的 操作 系统 ,不 只 是 计算 机 ,手机 现在 也 在 向 多 核发 展 。 最 新 的 手机 CPU 
已 经 达到 了 8 核 ,8 核 描述 的 是 手机 CPU 的 处 理 核心 ,可 以 同时 有 8 个 线程 进行 运算 。 多 
任务 的 情况 下 ,多 核 的 优势 就 很 明显 了 ,比如 手机 上 运行 大 型 游戏 ,视频 解码 等 。 

在 进行 多 线程 学 习 之 前 ,可 以 想象 一 些 场景 ,比如 前 面 写 的 (英雄 无 敌 》, 现 在 只 是 个 回 
合 制 的 游戏 , 即 在 地 图 上 或 者 开战 时 ,英雄 和 敌人 是 一 人 攻击 一 回合 。 但 如 果 想 让 英雄 和 
敌人 都 能 同时 在 地 图 上 移动 ,各 自 独立 开 来 ,比如 玩家 控制 英雄 移动 ,敌人 自行 在 地 图 上 随 
机 或 按 一 定 规律 移动 ,或 者 同时 有 几 百 个 人 在 地 图 上 移动 ,这 时 总 不 能 让 一 个 人 动 完 之 后 
再 让 另 一 个 人 动 。 这 种 情况 就 需要 多 线程 来 支持 了 。 


【> 有 EA 进程 与 线程 


要 想 学 习 多 线程 编程 ,首先 要 和 弄 清 楚 进程 和 线程 的 一 些 相关 概念 。 

(1) 进程 : 进程 是 一 个 具有 一 定 独立 功能 的 程序 关于 某 个 数据 集 
合 的 一 次 运行 活动 。 它 是 操作 系统 动态 执行 的 基本 单元 ,在 传统 的 操 
作 系 统 中 ,进程 既是 基本 的 分 配 单元 ,也 是 基本 的 执行 单元 。 狭 义 来 
说 ,进程 就 是 一 个 程序 执行 时 的 实例 ,动态 的 执行 过 程 存在 于 计算 机 的 
内 存 中 ,占用 CPU 资源 。 如 果 你 在 Windows 系统 中 用 过 进程 管理 , 那 
么 你 对 这 个 词 可 能 并 不 陌生 。 

(2) 程序 : 要 说 进程 ,就 不 得 不 说 程序 。 到 目前 为 止 ,我 们 都 在 学 习 怎 么 写 程序 ,其 本 
身 没有 任何 运行 的 含义 ,是 一 个 静态 的 概念 。 而 进程 则 是 在 处 理 机 上 的 一 次 执行 过 程 , 它 
是 一 个 动态 的 概念 。 这 个 不 难 理解 ,其 实 进程 是 包含 程序 的 ,进程 的 执行 离 不 开 程序 ,进程 
中 的 文本 区 域 就 是 代码 区 ,也 就 是 程序 。 

(3) 线程 : 通常 在 一 个 进程 中 可 以 包含 若干 个 线程 ,一 个 程序 至 少 有 一 个 线程 , 若 程序 
只 有 一 个 线程 , 那 就 是 程序 本 身 。 线 程 可 以 利用 进程 所 拥有 的 资源 ,在 引入 线程 的 操作 系 
统 中 ,通常 都 是 把 进程 作为 分 配 资 源 的 基本 单位 ,而 把 线程 作为 独立 运行 和 独立 调度 的 基 
本 单位 ,由 于 线程 比 进程 更 小 ,基本 上 不 拥有 系统 资源 , 故 对 它 的 调度 所 付出 的 开销 就 会 小 
得 多 ,能 更 高 效 地 提高 系统 多 个 程序 间 并 发 执行 的 程度 。 

(4) 多 线程 : 在 一 个 程序 中 ,这 些 独 立 运 行 的 程序 片段 叫 作 线程 (Thread) , 利用 线程 编 
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程 的 概念 就 叫 作 多 线程 处 理 。 多 线程 是 为 了 同步 完成 多 项 任务 ,不 是 为 了 提高 运行 效率 ， 
而 是 为 了 提高 资源 使 用 效率 来 提高 系统 效率 。 线 程 是 在 同一 时 间 需 要 完成 多 项 任务 时 实 
现 的 。 

多 线程 的 出 现 就 是 为 了 提高 效率 。 你 可 以 想象 一 下 ,火车 至 少 会 有 一 节 车 厢 ( 车 头 )， 
运行 时 多 节 车 厢 同 时 启动 ,多 线程 的 每 个 线程 就 像 火 车 的 每 一 节 车 厢 , 而 进程 则 是 火车 , 想 
要 多 运 货 就 增加 车 厢 。 

进程 和 线程 的 主要 差别 在 于 它们 是 不 同 的 操作 系统 资源 管理 方式 。 进 程 有 独立 的 地 
址 空间 ,一 个 进程 崩溃 后 ,在 保护 模式 下 不 会 对 其 他 进程 产生 影响 ,而 线程 只 是 一 个 进程 中 
的 分 支 任务 。 线 程 有 自己 的 堆栈 和 局 部 变量 ,但 线程 之 间 没 有 单独 的 地 址 空间 ,一 个 线程 
死 掉 就 等 于 整个 进程 死 掉 ,所 以 多 进程 的 程序 要 比 多 线程 的 程序 健壮 ,但 在 进程 切换 时 , 耗 
费 资 源 较 大 ,效率 要 差 一 些 。 

对 于 一 些 要 求 同 时 进行 并 且 又 要 共享 某 些 变 量 的 并 发 操作 ,只 能 用 线程 ,不 能 用 进程 。 
具体 情况 如 下 。 

(1) 一 个 程序 至 少 有 一 个 进程 ,一 个 进程 至 少 有 一 个 线程 。 

(2) 线程 的 划分 尺度 小 于 进程 ,使 得 多 线程 程序 的 并 发 性 高 。 

(3) 进程 在 执行 过 程 中 拥有 独立 的 内 存单 元 ,多 个 线程 共享 内 存 , 极 大 地 提高 了 程序 的 
运行 效率 。 

(4) 线程 在 执行 过 程 中 与 进程 的 区 别 在 于 ,每 个 独立 的 线程 有 一 个 程序 运行 的 入 口 , 顺 
序 执行 序列 和 程序 的 出 口 。 但 是 线程 不 能 够 独立 执行 ,必须 依存 在 应 用 程序 中 ,由 应 用 程 
序 提供 多 个 线程 执行 控制 。 

(5) 从 人 逻辑 角度 来 看 ,多 线程 的 意义 在 于 一 个 应 用 程序 中 有 多 个 执行 部 分 可 以 同时 执 
行 。 但 操作 系统 并 没有 将 多 个 线程 看 作 多 个 独立 的 应 用 ,来 实现 进程 的 调度 和 管理 以 及 资 
源 分 配 。 这 就 是 进程 和 线程 的 重要 区 别 。 

线程 和 进程 在 使 用 上 各 有 优 缺 点 : 线程 执行 开销 小 ,但 不 利于 资源 的 管理 和 保护 ;而 进 
程 正 相 反 。 同 时 ,线程 适合 在 多 核 处 理 机 机 器 上 运行 ,而 进程 则 可 以 跨 机 器 迁移 。 


oz 


Python 3 中 提供 了 一 个 threading 模块 用 来 支持 多 线程 编程 ,在 
Python 2 中 除了 threading 还 有 一 个 多 线程 模块 thread。 其 实 
threading 是 对 thread 的 封装 ,一 般 只 用 threading 就 可 以 了 。 


13.21 创建 线程 


创建 线程 之 前 , 先 假设 一 个 场景 吧 ,比如 播放 器 放 视 频 时 是 影像 和 
声音 同时 输出 的 ,那么 在 这 个 程序 的 进程 中 至 少 有 处 理 声音 和 影 的 两 个 线程 。 我 们 用 文字 
输出 分 别 代表 影像 和 声音 。 

对 于 多 线程 编程 ,我 们 可 以 直接 利用 threading. Thread 类 直接 生成 线程 对 象 来 生成 
线程 。 


© 
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#th 1.py 
import threading # 导 入 threading 模块 
def run(x,y): 

for i in range(y): 


print ("输出 $s 共 %d 次 "% (x,y)) 


# 生 成 两 个 线程 图 tl 和 t2 
tl = threading .Thread (target = run, args = (" 画 面 "，3) ) 
t2 = threading .Thread (target = run, args = ("声音 ", 3)) 


# 分 别 启动 两 个 线程 
til.start () 


t2.start () 


mm 


run ("画面 ",3) 
run ("声音 ",3) 


mm 


这 里 我 们 定义 的 函数 run, 如 果 像 注释 中 那样 直接 被 调用 两 次 , 则 会 依次 执行 ,然后 输 
出 如 下 : 


输出 画面 共 3 次 
输出 画面 共 3 次 
输出 画面 共 3 次 
输出 声音 共 3 次 
输出 声音 共 3 次 
输出 声音 共 3 次 


这 就 是 一 个 普通 的 按 顺 序 执行 的 过 程 ,并 没有 产生 多 线程 ,而 如 果 我 们 生成 L、t2 两 个 
线程 来 执行 ,效果 就 会 类 似 下 面 这 样 : 
输出 画面 共 3 次 输出 声音 共 3 次 


输出 画面 共 3 次 输出 声音 共 3 次 
输出 画面 共 3 次 输出 声音 共 3 次 


生成 线程 对 象 时 的 两 个 参数 : target 是 要 调用 的 函数 ,args 是 给 函数 传递 参数 。 除 了 
直接 生成 对 象 ,我 们 还 要 看 一 下 怎样 通过 继承 threading 模块 的 Thread 类 定义 一 个 新 的 
类 。 在 新 类 中 重 载 run 方法 ,再 通过 start 方法 创建 线程 。run 方法 会 在 线程 创建 后 自动 
运行 。 

#th 2.py 


import threading 
class MyThread (threading.Thread): 


def init _(self,x,y): # 子 类 定义 初始 化 方法 
threading.Thread. init _(self) # 调 用 父 类 初始 化 方法 
self.x, self.y=x,y 

def run(self): # 重 载 run 方法 














Python 快速 入 门 精 讲 





for i in range (self.y): 
print ("输出 $s 共 %d 次 "% (self.x, self.y)) 


t1 = MyThread ("画面 ",，3) 
t2 = MyThread ("声音 ",，3) 


tl.start () 
t2.start () 


13.22 线程 对 象 的 方法 


只 是 生成 线程 还 不 够 ,很 多 时 候 我 们 还 要 控制 线程 ,这 时 就 要 依靠 Thread 对 象 的 其 他 
方法 了 。 


1.isAlive 


当 我 们 创建 了 线程 之 后 ,有 时 需要 对 线程 进行 跟踪 ,可 以 通过 isAlive 方法 判断 线程 是 
否 运 行 ,如 果 正 在 运行 ,返回 True。 下 面 我 们 来 生成 一 个 可 以 持续 30 秒 的 线程 ,然后 来 查 
看 它 的 状态 ,线程 启动 后 ,30 秒 内 查看 ,都 是 True。 


>>>import time 
>>>import threading 
>>>def run(): 
print ("Start") 
time.sleep(30) 
print ("End") 
>>>t = threading.Thread (target = run) 
>>>t .start () 
Start # 线 程 启动 
>>>print (t.isAlive()) 


True 

End # 线 程 已 结束 
>>>print (t.isAlive()) 
False 

2. join 


虽然 线程 的 意义 是 为 了 同时 启动 多 个 任务 ,但 有 时 在 程序 运行 过 程 中 启动 了 某 一 个 线 
程 后 ,必须 等 这 个 线程 结束 才能 继续 其 他 线程 ,此 时 调用 join 方法 。 

比如 ,创建 线程 的 声音 和 画面 的 例子 ,在 tl. start() 之 后 先 执行 tt. join() 再 启动 t2, 这 
样 t2 就 要 等 到 tl 结束 才 会 开始 执行 。 


#th join.py 
import threading # 导 和 threading 模块 
def run (xvy) : 


for i in range(y) : 


print (" 输 出 ss 共 %d 次 "% (x,y)) 
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# 生 成 两 个 线程 图 t1 和 t2 
tl = threading .Thread (target = run，args = ("画面 ", 3)) 
t2 = threading .Thread (target = run，args = (" 声 音 "，3) ) 


# 分 别 启动 两 个 线程 
tl.start () 
t1.join() 
七 2. statt() 


3. 线程 名 


我 们 可 以 给 线程 起 一 些 好 记 易 懂 的 名 字 加 以 区 分 ,这 样 更 易于 控制 ,可 以 在 构造 函数 
中 通过 给 name 属性 赋值 来 设置 ,也 可 以 在 创建 线程 对 象 后 通过 setNmae 和 getName 方法 
来 设置 和 获取 。 


#th name.py 
import threading 
class MyThread (threading.Thread): 
def _ init _(self,threadName): 
threading.Thread. init _(self, name = threadName) 


tl = MyThread ("画面 ") 
print (tl.getName ()) 
t1.setName (' 声 音 ') 

print (tl.getName ()) 


4. setDeamon 


启动 线程 后 ,主线 程 要 退出 时 ,会 先 检查 子 线程 是 否 已 完成 ,如 果子 线程 未 完成 , 则 会 
等 待 子 线程 完成 再 退出 。 实 际 上 很 多 软件 都 是 关闭 之 后 就 直接 终止 一 切线 程 ,这 种 情况 设 
置 daemon 属性 为 True 就 可 以 了 。 比 如 声音 画面 的 线程 本 身 可 能 要 执行 两 个 小 时 ,但 只 要 
对 线程 对 象 的 daemon 属性 值 为 True, 则 进程 结束 时 不 会 等 待 线程 而 直接 退出 。 

可 以 改写 声音 和 画面 的 小 例子 ,让 声音 (t2) 执 行 60 秒 ,画面 (tl) 执 行 20 秒 ,但 是 通过 
setDaemon 设置 t2 的 daemon 属性 为 True ,动手 试 试看 效果 吧 ,t2 是 否 执行 够 60 秒 呢 ? 


1 人 13.2.3 ”线程 锁 


多 线程 的 程序 有 可 能 会 涉及 多 个 线程 同时 操作 一 个 数据 ,如 果 不 加 由 
进行 控制 ,就 会 哪个 线程 最 后 修改 则 保存 哪个 线程 的 修改 。 为 保证 数 
据 的 安全 ,这 时 就 要 加 线程 锁 , 也 就 是 实现 数据 同步 。 

最 简单 线程 同步 就 是 线程 锁 ,其 实 是 threading 模块 ,Lock 类 和 
RLock 类 都 可 以 用 来 实现 简单 的 线程 同步 。Lock 类 和 RLock 类 都 提 
供 了 acquire 方法 和 release 方法 多 线程 保护 数据 ,简单 说 就 是 同一 时 
间 只 能 一 个 线程 对 数据 进行 操作 。 这 样 的 线程 只 要 放 在 acquire 方法 和 release 方法 就 可 


A 
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以 了 。 
下 面 我 们 模拟 5 个 线程 同时 修改 一 个 数据 的 情形 来 看 一 下 如 何 通过 Lock 进行 线程 
同步 。 


#th syn.py 
import threading 
import time 
class MyThread (threading.Thread): 
def run (self) : 
global x db 
lock.acquire () # 调 用 所 对 象 方 法 加 锁 
x db+=1 
time.sleep(5) 
Print(x_db) 
lock.release() # 调 用 锁 对 象 解锁 


lock = threading.Lock () # 生 成 Lock 对 象 (生成 锁 ) 


for i in range(5) : 
tn = MyThread () 
t5.append (tn) 


£0r An ts 
j.start() 


因为 有 锁 的 控制 ,所 以 线程 间 并 不 会 相互 影响 ,每 次 只 有 一 个 线程 在 对 数据 进行 修改 ， 
线程 生存 5 秒 , 解 锁 之 前 看 到 的 就 是 当前 线程 的 修改 结果 ,所 有 线程 结束 是 25 秒 。 效 果 
如 下 : 


an ww N PP 


但 是 ,如 果 把 代码 中 有 注释 的 三 行 代码 删除 , 则 相当 于 没有 线程 同步 控制 ,所 有 线程 同 
时 对 数据 进行 操作 ,因为 5 秒 的 时 间 足 够 所 有 线程 执行 完毕 了 ,所 以 当 所 有 线程 都 执行 后 ， 
数据 已 经 累加 到 最 大 ,此 时 第 一 个 线程 在 5 秒 后 输出 的 也 是 最 后 的 结果 ,整个 进程 执行 5 秒 
左右 ,结果 如 下 ,每 个 线程 的 输出 都 是 5。 


wm wm wm wu ou 


全 
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13.24 多 线程 的 本 质 


学 会 了 多 线程 的 实现 方法 并 不 代表 什么 情况 都 要 用 ,Python 多 线程 实际 上 有 时 并 不 会 
发 挥 它 的 作用 ,因为 在 Python 通过 全 局 解释 锁 来 确保 同一 时 间 只 能 有 一 个 线程 执行 任务 ， 
也 就 是 说 即便 我 们 看 到 的 执行 效果 好 像 是 多 个 任务 并 发 执行 ,但 实际 上 在 CPU 上 只 是 在 
交替 执行 而 已 ,只 不 过 CPU 的 运算 速度 足够 快 ,感觉 不 出 来 罢了 。 也 就 是 说 如 果 是 8 核 
CPU, 那 么 多 线程 并 不 能 充分 利用 上 。 所 以 ,如 果 想 要 高 效 地 利用 多 核 CPU 进行 计算 密集 
型 任务 ,需要 使 用 多 进程 。 

虽然 看 起 来 有 些 鸡 肋 ( 因 为 在 高 并 发 计算 中 并 没有 优势 ,Python 不 是 什么 都 强大 的 )， 
但 是 如 果 是 I/O 密集 型 的 工作 ,多 线程 就 非常 适合 。 因 为 I/O 任务 的 重点 在 IO 上 ,并 不 
在 计算 上 , 当 一 个 任务 阻塞 在 W/O 操作 上 时 ,我 们 可 以 立即 启动 其 他 线程 执行 其 他 操作 。 


[> 大 实例 : 批量 主机 扫描 


设想 一 个 从 事 运 维 工 作 的 工作 人 员 ,管理 着 100 台 服 务 器 。 那 么 ， 
在 日 常 工作 中 如 何 快速 判断 这 100 台 服 务 器 的 网 络 是 否 畅通 呢 ? 最 简 
单 的 办 法 就 是 写 个 脚本 通过 ping 命令 来 判断 主机 状态 ,但 是 100 台 一 
个 一 个 的 测试 显然 效率 不 高 ,所 以 ,我 们 干脆 直接 通过 多 线程 ,相当 于 
同时 对 100 台 主 机 ping。 下 面 就 来 看 下 这 个 程序 。 





#!/usr/bin/python 

#th ping.py 

from threading import Thread 
import subprocess 

from queue import Queue 


queue5 = Queue () 

ips = ['10.0.2.11°', 
?10052227 
'10.0.2.13', 
"10.0.2.14", 
'10.0.2.15"] 


def pinger (i, q): 
while True: 

ip =q.get() # 从 队列 中 取出 一 个 元 素 

Print("Thread ss : Pinging: ss "%(i, ip)) 

ie 

ret = subprocess.call('ping -c1%s' $ip, 
shell= True, 
stdout= open('/dev/null', 'w'), 
stderr= subprocess.STDOUT) 


#windows 


207 
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ret = subprocess.call('ping -c 1%s' Sip, 
shell = True, 
stdout = open ('NUL', 'w'), 
stderr = subprocess.STDOUT) 


if ret == 0: 
print('%s : is alive' %ip) 
else: 


print('%s : did not respond' sip) 
qtask done () 
# 占 位 ,在 完成 一 项 任务 之 后 ,向 任务 已 经 完成 的 队列 发 送 一 个 信号 


for i in range(3) : 
th = Thread (target =Pinger，args = (i, queue5)) 
th .setDaemon (True) # 设 置 daemon 属性 为 True 
th .start() 


for ip in ips: 
queue5.put (ip) # 向 对 列 添加 元 素 


print ("Main Thread waiting...") 
queue5.join() # 阻 塞 调用 线程 ,直到 队列 中 的 所 有 任务 被 处 理 掉 
Print('Done') 


在 这 段 代 码 中 ,我 们 将 主机 数 设 置 为 5 个 ,实际 100 个 的 原理 是 一 样 的 ,你 也 可 以 将 主 
机 ip 存储 到 数据 库 中 进行 管理 。 创 建 了 3 个 线程 来 处 理 这 5 个 ping, 你 也 可 以 创建 5 个 。 

这 里 用 到 两 个 新 的 模块 : subprocess 和 queue。 

subprocess 的 作用 是 用 来 管理 子 进程 ,可 以 调用 外 部 程序 ,通常 可 以 用 来 作 多 进程 的 工 
具 , 这 里 我 们 用 call 方法 来 调用 ping 命令 ,其 中 的 三 个 参数 ,shell= True 表示 接收 字符 串 
形式 的 命令 ,为 了 不 在 终端 显示 ping 命令 的 输出 ,通过 stdout 和 stderr 将 标准 输出 和 标准 
错误 输出 进行 重 定 向 。 

Queue 的 作用 是 用 来 创建 一 个 单项 队列 ,通过 这 个 队列 管理 线程 会 更 方便 一 些 , 其 中 
用 到 的 几 个 方法 已 经 做 了 注释 说 明 ,看 程序 就 能 明白 作用 了 。 

最 后 运行 的 效果 类 似 这 样 。 


Main Thread waiting... 

Thread 0 : Pinging: 10.0.2.11 
Thread 1 : Pinging: 10.0.2.12 
Thread 2 : Pinging: 10.0.2.13 


10.0.2.12 : is alive 

Thread 1 : Pinging: 10.0.2.14 
10.0.2.11 : is aliVe 

Thread 0 : Pinging: 10.0.2.15 
10.0.2.13 : did not respond 
10.0.2.14 : is alive 
10.0.2.15 : is alive 

Done 


夕 
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[ 硬 重点 提示 


在 这 一 章 中 ,你 要 掌握 的 内 容 : 
(1) 明确 进程 和 线程 的 作用 和 区 别 。 
(2) 掌握 多 线程 的 创建 和 控制 方法 。 


人 动 动手 


实现 一 个 多 线程 备份 大 文件 的 类 , 带 有 智能 判断 功能 ,所 有 大 于 指定 大 小 的 文件 自动 
进行 多 线程 备份 ,比如 有 10 个 日 志 , 每 个 1GB, 则 实现 多 线程 备份 。 





网 络 应 用 编程 


在 互联 网 时 代 ,编程 又 怎 能 离开 网 络 呢 ! Python 标准 库 中 提供 了 丰富 的 网 络 相 关 功 能 
的 支持 ,总 的 来 说 ,分 成 两 类 : 一 类 是 针对 特定 应 用 级 的 网 络 协议 封装 的 库 , 比 如 FTP、 
HTTP、SMTP、POP 等 ; 另 一 类 是 提供 了 底层 操作 系统 中 的 基本 套 接 字 (socket) 支 持 ,可 以 
实现 面向 连接 和 无 连接 协议 的 客户 端 和 服务 器 。 

除了 标准 库 以 外 ,还 有 专门 针对 网 络 编程 的 框架 Twisted。Twisted 是 用 Python 实现 
的 基于 事件 驱动 的 网 络 引擎 框架 ,Twisted 支持 许多 常见 的 传输 及 应 用 层 协议 ,包括 TCP、 
UDP、SSL/TLS HTTP、IMAP、SSH IRC 以 及 FTP。 

如 果 你 的 网 络 基础 知识 不 好 ,也 不 用 担心 ,我们 从 应 用 出 发 来 了 解 用 Python 如 何 进行 
网 络 编程 。 


[> 有 网 络 应 用 开发 


Python 标准 库 中 的 网 络 模块 非常 好 用 ,即使 你 不 明白 网 络 协议 是 什么 也 可 以 很 轻松 地 
实现 网 络 应 用 的 基本 开发 ,下 面 我 们 来 看 一 下 urllib 库 的 基本 用 法 。 

首先 从 名 字 就 能 看 出 来 ,urllib 这 个 库 主 要 是 用 来 处 理 URL( 统 一 资源 定位 符 ) 的 。 

通过 urllib 库 可 以 很 方便 地 获取 指定 网 页 的 源 代码 ,如 果 使 用 GUI 的 HTML 组 件 , 就 
可 以 轻松 地 做 一 个 简单 的 Python 实现 的 Web 浏览 器 。 

urllib 库 包括 以 下 模块 。 

(1) urllib. request: 请 求 模块 。 

(2) urllib. error: 异常 处 理 模 块 。 

(3) urllib. parse url: 解析 模块 。 

(4) urllib. robotparser: robots. txt 解析 模块 。 

下 面 介绍 怎么 用 urllib. request 获取 一 个 网 页 的 源 代码 ,这 个 功能 对 于 写 息 虫 非常 
实用 。 

urllib. request 的 urlopen 方法 可 以 返回 一 个 类 似 file 的 对 象 ,可 以 像 读 取 文 件 一 样 获 
取 网 页 源 代码 。 就 像 下 面 这 样 : 


>>>import urllib.request 

>>>page = urllib.request.urlopen ("http://www.python.org") 
>>>page.readline() 

b'<!doctype html>\n' 
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这 是 最 简单 的 形式 ,只 需要 提供 一 个 URL 地 址 给 urlopen 即 可 ,page 获得 的 值 就 是 当 
前 网 页 的 源 代码 。 
如 果 想 把 源 代码 保存 为 一 个 文件 ,可 以 通过 urllib. request 的 urlretrieve 方法 实现 : 


>>>from urllib import request 

>>>request .urlretrieve("http://www.python.org", "file.txt") 

('file.txt', <http.client .HTTPMessage object at 0x06639890>) 

>>> import os 

>>>0s.listdir() 

['boa- constructor- wininst .10g', 'cla- fs.py', 'DLLsS', 'Doc', 'file.txt', 'hero.db', 
"include', 'NEWS .txt', 'python.exe'] 


除了 urllib, 还 有 一 些 看 名 字 就 知道 用 处 的 模块 ,如 果 有 需要 可 以 在 手册 查找 ,通常 手 
册 上 都 会 有 一 些 简单 的 例子 ,很 实用 。 

(1) ftplib: 用 于 访问 FTP 服务 器 ,可 上 传 、 下 载 等 。 

(2) poplib: 实现 了 POP 3 协议 ,用 来 收 邮件 。 

(3) smtplib: 实现 SMTP 协议 ,可 以 发 送 纯 文本 邮件 .HTML 邮件 以 及 带 附件 的 邮件 。 


socket 编程 


对 于 Python 网 络 编程 ,一 定 会 用 到 socket 模块 。socket ( 套 接 字 ) 
是 双向 通信 信道 的 端点 。 应 用 程序 通常 通过 “ 套 接 字 ”向 网 络 发 出 请 求 或 
者 应 答 网 络 请 求 , 使 主机 间或 者 一 台 计 算 机 上 的 进程 间 可 以 通信 。 在 不 
同 主机 的 进程 之 间 进 行 通信 ,主机 可 以 是 任何 一 台 连 接 网 络 的 机 器 。 

我 们 可 以 通过 socket 模块 编写 客户 端 和 服务 器 端 程序 ,比如 编写 局 et 
域 网 聊天 室 ( 或 者 聊天 软件 ) .文件 传输 工具 程序 等 。 





前 面 介绍 的 封装 好 的 模块 ,用 起 来 很 方便 ,但 是 做 底层 开发 就 不 够 灵活 了 ,而 socket 模 
块 则 提供 了 更 底层 的 接口 。 


如 果 以 创建 一 个 游乐 园 为 例 , 封 装 好 的 模块 相当 于 整套 过 山 车 或 一 个 精灵 屋 , 你 可 以 
拿 来 用 ,但 是 不 能 做 更 多 更 灵活 的 更 改 , 比 如 ,不 能 把 过 山 车 变 成 精灵 屋 , 因 为 它 的 功能 已 
经 被 限定 了 。 而 socket 模块 则 像 螺 丝 、 零 件 ,水 泥 等 ,你 想 要 什么 ,就 可 以 灵活 地 建造 。 


14.2.1 _ socket 连接 过 程 


网 络 服务 都 是 建立 在 socket 基础 之 上 的 ,socket 是 网 络 连接 端点 ,是 网 络 的 基础 ,每 个 
socket 都 被 绑 定 到 指定 的 IP 和 端口 上 。 

套 接 字 可 以 通过 多 种 不 同 的 通道 类 型 实现 ,如 Unix 域 套 接 字 、TCP、UDP 等 。 套 接 字 
库 提供 了 处 理 公共 传输 的 特定 类 ,以 及 一 个 用 于 处 理 其 余部 分 的 通用 接口 。 

利用 socket 建立 网 络 连接 的 步 又 (一 对 套 接 字 连接 过 程 ) 如 下 。 

(1) 服务 器 监听 : 服务 器 端 套 接 字 并 不 定位 具体 的 客户 端 套 接 字 ,而 是 处 于 等 待 连接 
的 状态 ,实时 监控 网 络 状态 ,等 待 客户 端的 连接 请 求 。 

(2) 客户 端 请 求 : 指 客户 端的 套 接 字 提出 连接 请 求 ,要 连接 的 目标 是 服务 器 端的 套 接 
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字 。 为 此 ,客户 端的 套 接 字 必 须 首先 描述 它 要 连接 的 服务 器 的 套 接 字 , 指 出 服务 器 端 套 接 
字 的 地 址 和 端口 号 ,然后 向 服务 器 端 套 接 字 提出 连接 请 求 。 

(3) 连接 确认 : 当 服务 器 端 套 接 字 监听 到 或 者 接收 到 客户 端 套 接 字 的 连接 请 求 时 ,就 
响应 客户 端 套 接 字 的 请 求 ,建立 一 个 新 的 线程 ,把 服务 器 端 套 接 字 的 描述 发 给 客户 端 ,一 旦 
客户 端 确认 了 此 描述 ,双方 就 正式 建立 连接 。 而 服务 器 端 套 接 字 继续 处 于 监听 状态 ,继续 
接收 其 他 客户 端 套 接 字 的 连接 请 求 。 


14.22 创建 socket 对 象 


了 解 了 socket 的 连接 步骤 ,我 们 就 可 以 创建 socket 了。 首先, 无 论 是 服务 端 还 是 客户 
端 都 需要 先生 成 一 个 socket 对 象 。 

socket 是 进程 通信 的 一 种 方式 , 即 调用 这 个 网 络 库 的 一 些 API 函数 实现 分 布 在 不 同 主 
机 的 相关 进程 之 间 的 数据 交换 。 那 么 要 想 在 两 个 主机 之 间 建 立 连接 ,就 要 遵守 同样 的 规 
则 。 这 里 有 些 概念 需要 先 了 解 。 

(1) 每 个 socket 都 被 绑 定 到 指定 的 IP 和 端口 上 。 

Q@ IP 地 址 : 即 依照 TCP/IP 协议 分 配给 本 地 主机 的 网 络 地 址 ,两 个 进程 要 通信 , 任 一 
进程 首先 要 知道 通信 对 方 的 位 置 , 即 对 方 的 IP。 

@ 端口 号 : 用 来 辨别 本 地 通信 进程 ,一 个 本 地 的 进程 在 通信 时 均 会 占用 一 个 端口 号 ， 
不 同 的 进程 端口 号 不 同 ,因此 在 通信 前 必须 要 分 配 一 个 没有 被 访问 的 端口 号 。 

(2) 数据 传输 的 模式 基本 是 TCP 和 UDP 两 种 ,TCP 和 UDP 的 区 别 如 下 。 

Q@ TCP 是 面向 连接 的 ,连接 经 过 三 次 握手 ,很 大 程度 保证 了 连接 的 可 靠 性 。 

@ UDP 传送 数据 前 并 不 与 对 方 建立 连接 ,对 收 到 的 数据 也 不 发 送 触 诊 信号 ,因此 UDP 
的 开销 更 小 ,数据 传输 速率 更 高 。QQ 就 是 采用 UPD 协议 传输 ,而 相似 的 MSN 采用 的 是 
TCP 协议 传输 。 

创建 socket 对 象 需要 通过 socket 模块 的 socket 方法 。 语 法 如 下 : 


socket .socket ([family[, type[,protocol]]]) 


参数 说 明 如 下 。 

(1) family 地 址 徐 : 用 于 socket() 函数 的 第 一 个 参数 ,有 以 下 三 个 模式 。 

@ socket. AF_UNIX: 用 于 单一 机 器 下 的 进程 通信 。 

@ socket. AF_INET: 用 于 服务 器 之 间 相 互通 信 ( 通 常 都 用 这 个 ) 。 

@ socket. AF_INET6: 支持 IPv6。 

(2) type: 两 个 端点 之 间 的 通信 类 型 。 

Q@ 用 于 TCP 的 面向 连接 的 协议 的 SOCK_STREAM。 

@ 用 于 UDP 的 无 连接 协议 的 SOCK_DGRAM。 

(3) protocol: 通常 为 0, 用 于 标识 域 和 类 型 中 的 协议 的 变 体 , 可 选项 ,不 用 指定 。 
创建 TCP socket: 


S = Socket .socket (socket.RAF INET, socket.SOCK STREAM) 
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创建 UDP socket: 


S = Socket .socket (socket .AF INET, socket.SOCK DGRAM) 


14.2.3 基于 TCP 的 客户 端 和 服务 端 


socket 对 象 的 方法 按 用 处 可 以 分 为 三 类 : 服务 端 、 客 户 端 和 通用 。 

以 TCP 为 例 , 分 别 创建 服务 端 和 客户 端的 基本 模型 ,由 客户 端 向 服务 端 发 送 字符 串 , 服 
务 端 接收 并 打印 到 屏幕 上 ,然后 发 给 客户 端 一 个 字符 串 。 

服务 端 代 码 如 下 : 


#tcpserver.py 

import socket 

S = socket.socket (socket.AF INET, socket.SOCK STREAM) 
s.bind(("127.0.0.1", 6000)) 

s.listen(10) 

print('Waiting for connection...') 


clients, clientaddr = s.accept () 
data = clients.recv(1024) 
print("client ss say: %s"%(clientaddr, data.decode ())) 


clients.send(b"hello, i am Server") 
Clients.close() 


客户 端 代码 如 下 : 


#tcpclient.py 

import socket 

S = socket.socket (socket .AF INET, socket.SOCK STREAM) 
s.connect(("127.0.0.1", 6000)) 

s.send(b"hello,i am client") 


data = s.recv(1024) 
print ("server say: $s" %data.decode ()) 
s.close() 


因为 这 里 的 两 个 脚本 都 在 一 台 主 机 上 ,所 以 在 运行 时 直接 在 命令 行 模式 用 两 个 终端 分 
别 运行 。 先 启动 一 个 终端 运行 服务 端 程序 : 


C:\CrazyPythonZeroToHero\code\14>python tcpserver .py 
Waiting for connection... 


此 时 服务 器 处 于 监听 状态 ,也 就 是 等 待 有 人 来 连接 , 接 下 来 再 启动 一 个 命令 行 模式 终 
端 运行 客户 端 , 当 客 户 端 运行 时 ,就 会 向 服务 器 发 送 消息 ,服务 器 也 会 监听 到 连接 ,然后 继 
续 后 面 的 操作 。 

客户 端 运行 后 的 效果 : 
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C:\CrazyPythonZeroToHero\code\14>python tcpserver.py 
server say: b'hello, i am Server' 


接收 到 客户 端 信息 之 后 的 服务 端 : 
C:\CrazyPythonZeroToHero\code\14>python tcpserver .py 


Waiting for connection... 
client ('127.0.0.1', 50759) say: b'hello,i am client' 


看 到 效果 后 我 们 来 解释 一 下 服务 端 和 客户 端的 关键 代码 。 
1. 服务 端 
(1) s = socket.socket (socket .AF INET, socket.SOCK STREAM) 


创建 socket 对 象 ,同时 通过 参数 设 定 socket 对 象 的 通信 模式 为 AF_INET, 数 据 传输 模 
式 为 TCP。 


(2) s.bind(("127.0.0.1", 6000)) 


绑 定 服务 器 的 IP 地 址 和 端口 ,如 果 地 址 为 空 则 表示 本 机 ,地 址 最 好 大 于 5000 小 于 
65535, 因 为 预 留 端口 就 在 这 个 区 间 。 


(3) s.listen(backlog) 


开始 TCP 监听 。backlog 指定 在 拒绝 连接 之 前 ,操作 系统 可 以 挂 起 的 最 大 连接 数量 。 
该 值 至 少 为 1, 大 部 分 应 用 程序 设 为 5 就 可 以 了 。 


(4) clients, clientaddr = s.accept () 


被 动 接受 TCP 客户 端 连接 , (阻塞 式 ) 等 待 连接 的 到 来 ,接收 来 自 客户 端的 数据 ,返回 一 
个 新 的 socket 对 象 和 客户 端 地 址 。 


(5) data = clients.recv (bufsize) 
接收 TCP 数据 ,数据 以 字符 串 形 式 返 回 ,bufsize 指定 要 接收 的 最 大 数据 缓存 量 。 
(6) clients.send(b"hello, i am Server")) 


向 已 经 连接 的 socket 发 送 数 据 ,在 Python 3 中 ,所 有 数据 的 传输 必须 用 bytes 类 型 
(bytes 只 支持 ascii 码 ), 所 以 在 发 送 数 据 时 要 么 在 发 送 的 字符 串 前 面 加 'b', 要 么 使 用 
encodeCutf-8) 转 换 成 bytes 类 型 发 送 , 但 是 在 接收 端 必 须 用 decode() 进 行 转 码 。 


2. 客户 端 


s.connect(("127.0.0.1", 6000)) 
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客户 端 跟 服务 端 不 同 ,不 需要 绑 定 也 不 需要 监听 ,但 是 需要 制定 连接 的 服务 器 ,connect 
连接 到 给 定 地 址 处 的 套 接 字 。 一 般 地 址 的 格式 为 元 组 (hostname,port), 如 果 连 接 出 错 , 返 
回 socket. error 错误 。 

至 此 ,一 对 简单 的 客户 端 和 服务 端 就 实现 了 。 你 可 以 考虑 写 一 个 服务 端 和 客户 端 来 回 
发 消息 的 聊天 工具 , 写 完 检查 是 否 有 问题 ,有 没有 改进 的 办 法 。 然 后 再 考虑 能 不 能 实现 一 
个 带 图 形 界面 的 局 域 网 聊天 室 。 


14.2.4 基于 UDP 实现 多 线程 收发 消息 


14. 2. 3 小节 的 最 后 我 们 说 到 了 要 实现 服务 端 和 客户 端 互 发 消息 ,如 果 你 动手 做 了 ,并 
且 采 取 TCP 协议 直接 将 accept、send 和 recv 放 到 了 循环 中 ,就 会 发 现 一 个 问题 ,这 样 简单 
的 循环 是 无 法 实现 一 直 发 消息 或 者 一 直接 收 消息 的 ,因为 accept 方法 会 产生 中 断 的 效果 ， 
并 且 send 和 recv 又 是 按 顺 序 执行 的 。 要 怎么 解决 这 个 问题 呢 ? 聪明 的 你 想到 多 线程 
没有 ? 

不 错 , 我 们 只 需要 将 发 送 和 接收 分 别 作为 两 个 线程 ,这 样 就 不 会 互相 影响 了 。 本 小 节 
我 们 通过 UDP 以 及 多 线程 来 实现 这 个 例子 ,掌握 方法 后 你 也 可 以 试 一 下 TCP 协议 的 服务 
端 和 客户 端 模式 来 实现 。 

首先 要 说 明 一 下 UDP 的 工作 方式 跟 TCP 有 一 个 区 别 : UDP 模式 不 需要 accpet 等 待 
来 自 客户 端的 连接 请 求 ,发 送 端 只 需要 指定 地 址 和 端口 直接 发 送 , 接 收 端 则 需要 绑 定 字 节 
接收 信息 的 地 址 和 端口 。 下 面 就 来 看 下 基本 的 发 送 端 和 接收 端 代码 。 


# 发 送 端 
#udpSend.py 
import socket 
with socket.socket (socket .AF INET, socket.SOCK DGRAM) as s: 
addr = ("192.168.122.1", 6000) 
s.sendto("Hello Python", addr) #sendto 的 作用 是 将 字符 串 发 送 至 指定 地 址 


# 接 收 端 

#udpRecv.py 

import socket 

with Socket .socket (socket .AF INET, socket.SOCK DGRAM) as s: 
addr = ("192.168.122.1"，6000) “# 本 机 IP 地 址 和 端口 
s.bind(addr) 
data, addr = s.recvfrom(1024) #1024 是 缓存 数据 ,单位 是 bytes 
print (data) 


明白 了 UDP 的 工作 方式 ,就 可 以 结合 多 线程 来 实现 类 似 聊天 软件 的 收发 消息 功能 了 。 
因为 可 以 通过 sento 向 任意 主机 发 送 消 息 且 不 需要 对 方 accept, 所 以 可 以 用 一 个 通用 脚本 
运行 在 各 个 主机 上 就 可 以 了 ,代码 如 下 : 


#sock udp thread.py 
import socket 
from threading import Thread 
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PORT = 6000 # 所 有 终端 使 用 同一 个 端口 
HOST = '192.168.122.1' # 本 机 IP 
def send(sock, addr): 
Say 一 
while i say != 'bye' : 
i say= input('i say:') 
sock.sendto(i say.encode('utf8'),addr) 


def recv (sock): 
while True: 
Pass #event ctrl 
other say, addr = sock.recvfrom (1024) 
print('{} say>{}'.format (addr [0], 
other say.decode('utf-8'))) 


with socket.socket (socket .AF INET, socket.SOCK DGRAM) as s: 
s.bind((HOST, PORT)) 
ipaddr = input ('you want say to (ip) :') # 获 取 接 收 者 的 IP 
addr = (ipaddr, 6000) 


sendTH = Thread (target = send, args = (s, addr)) 
sendTH.setDaemon (True) 

sendTH. start () 

recvTH = Thread (target = recv, args = (s,)) 
recvTH.setDaemon (True) 

recvTH.start () 

sendTH.join () 

recvTH.join () 


这 样 每 个 主机 都 运行 这 个 脚本 ,就 可 以 向 其 他 主机 发 送 消息 了 。 如 果 你 是 在 一 台 主 机 
做 这 个 实验 ,可 以 用 两 个 终端 运行 两 个 绑 定 了 本 机 不 同 IP 地 址 的 脚本 来 做 实验 ,比如 我 就 
是 一 个 绑 定 到 127. 0. 0. 1 , 另 一 个 绑 定 到 192. 168. 122. 1。 


>be 实例 : 局 域 网 聊天 室 


掌握 了 GUI 多 线程 等 很 多 实用 的 工具 后 ,我 们 来 写 一 个 局 域 网 聊天 室 吧 。 之 前 我 们 
已 经 接触 到 了 一 些 软 件 工程 中 的 步骤 ,比如 需求 分 析 、 编 码 、 测 试 等 ,但 是 并 不 系统 ,所 以 就 
以 软件 工程 开发 的 形式 来 开发 这 个 聊天 室 。 


14.31 需求 分 析 


开发 软件 的 第 一 步 是 需求 分 析 , 就 像 我 们 在 写 ( 英 雄 无 敌 ) 时 ,就 进行 了 一 些 初步 的 分 
析 。 实 际 工 作 中 ,通常 会 是 产品 经 理 、 客 户 、 测 试 工程 师 等 项 目 相 关 人 员 讨 论 软 件 的 具体 功 
能 ,以 及 大 概 的 效果 等 ,最 后 会 生成 软件 需求 说 明 书 。 程 序 员 拿 到 需求 说 明 书 就 可 以 按 步 
又 开发 了 。 

现在 对 局 域 网 聊天 室 的 功能 需求 主要 有 以 下 几 点 。 
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(1) 软件 支持 多 人 同时 在 局 域 网 内 首发 文字 消息 ,每 个 人 发 送 的 消息 ,大 家 都 能 看 到 。 

(2) 每 个 人 可 以 给 自己 起 个 昵称 ,但 昵称 不 能 为 空 ,软件 启动 时 ,在 用 户 未 起 昵称 前 , 随 
机 生成 一 个 4 个 字符 的 昵称 。 

(3) 聊天 记录 中 显示 聊天 信息 的 格式 为 用 户 昵称 -时 间 - 换 行 -用 户 消息 。 

(4) 用 户 启动 软件 后 ,自动 加 入 聊天 室 。 


14.32 概要 设计 


确认 了 需求 之 后 ,第 二 步 是 进行 概要 设计 ,这 时 的 工作 就 是 将 软件 按照 功能 进行 划分 ， 
分 多 个 模块 ,每 个 模块 实现 独立 功能 ,各 个 模块 提供 互相 配合 的 接口 。 作 为 图 形 工 具 , 还 需 
要 完成 聊天 室 的 界面 设计 工作 。 

根据 图 14-1 这 个 界面 和 需求 分 析 , 局域网 聊天 室 项 目 主要 分 为 三 个 模块 。 
































国 Milo 的 局 域 网 聊天 室 VO.1 口 X 
31596274 2018-05-02 14:33:14 : a 
昵称 | 836496673| 
份子 ! 朋友 ! 和 | 国生 

发 关 
~ 




















14-1 局 域 网 聊天 室 原型 


(1) GUI 模块: 负责 接收 用 户 的 消息 并 显示 所 有 人 发 出 的 消息 ,提供 一 个 良好 的 交互 
体验 。 

(2) 消息 接收 模块 : 负责 从 网 络 接收 用 户 发 出 的 消息 。 

(3) 消息 发 送 模块 : 将 用 户 的 消息 发 送出 去 。 


14.3.3 详细 设计 


概要 设计 只 是 将 任务 划分 开 , 接 下 来 就 是 每 个 模块 内 部 具体 的 实现 方式 。 如 果 是 比 
较 大 的 项 目 , 每 个 模块 分 给 一 个 项 目 组 ,各 个 项 目 组 要 针对 各 自 的 模块 功能 进行 更 具体 
的 设计 ,比如 模块 实现 的 流程 .具体 的 功能 实现 方式 等 。 三 个 模块 具体 的 流程 分 别 设 计 
如 下 < 

(1) 用 户 界面 模块 流程 , 见 图 14-2。 

(2) 消息 发 送 模块 流程 , 见 图 14-3。 
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等 待 用 户 输入 





将 用 户 输入 、 时 间 和 
昵称 拼接 成 完整 消息 


| 一 | 获取 消息 缓冲 区 队列 锁 





[ 释放 缓冲 


图 14-2 用户 界面 模块 流程 图 
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获取 消息 缓冲 区 的 锁 
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取出 待 发 送 的 消息 
并 且 发 送 











休眠 1 秒 


ee 


释放 消 








息 缓冲 区 的 锁 





图 14-3 ”消息 发 送 模块 流程 图 


(3) 消息 接收 模块 流程 , 见 图 14-4。 








等 待 接收 


网 络 消息 








接收 到 新 消息 
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分 别 设计 出 模块 后 ,可 以 看 出 ,每 个 模块 都 可 以 单独 工作 ,但 又 需要 其 他 模块 的 消息 ， 
比如 GUI 要 一 直 在 屏幕 上 显示 ,同时 有 人 发 消息 ,又 都 会 接收 到 消息 。 三 个 模块 需要 同时 
工作 ,所 以 ,在 程序 设计 时 要 用 到 多 线程 。 另 外 ,在 消息 处 理 的 时 候 也 需要 多 线程 ,前 面 实 
现 的 简单 例子 是 单线 程 的 ,客户 端 和 服务 端 必须 等 待 上 一 个 操作 完成 才 会 进入 下 一 步 ,这 
显然 不 符合 聊天 室 的 模式 (你 不 能 在 发 消息 时 还 要 先 等 着 别人 的 消息 到 了 再 发 ) 。 

综合 三 个 模块 来 看 一 下 数据 从 输入 到 发 送 再 到 接收 的 完整 数据 流 , 如 图 14-5 所 示 。 


从 图 中 会 发 现 一 点 ,GUI 向 消息 缓冲 区 放 和 人 数据 ,消息 发 送 模块 从 消息 缓冲 区 读 取 数 
据 并 发 送 , 消 息 接收 模块 接收 消息 并 传送 给 GUI 显示 ,两 个 模块 同时 运行 并 且 使 用 同一 个 
消息 缓冲 区 ,所 以 ,在 消息 缓冲 区 读 写 时 需要 加 锁 ,以 保证 同一 时 间 段 只 有 一 个 线程 。 
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图 14-4 消息 接收 模块 流程 图 














GUI 将 用 户 输入 的 消息 | | 消息 发 送 模块 从 缓冲 
放 入 消息 缓冲 区 区 读 取 数据 并 发 送 
GUI 显 示 著 天 记录 “| 一 | “接收 模块 接收 消息 








并 传送 给 GUI 显示 








图 14-5 ”模块 间 数 据 流 
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14.34 编码 阶段 


当 完 成 详细 设计 之 后 就 可 以 将 所 有 工作 交 给 程序 员 了 ,程序 员 要 做 的 就 是 将 所 有 设计 
描述 编 成 代码 来 实现 。 这 里 分 三 个 模块 ,假设 将 三 个 模块 给 了 三 个 小 组 ,每 个 小 组 完成 自 
己 的 部 分 ,最 终 合 在 一 起 运行 。 

我 们 先 大 致 了 解 一 下 开发 的 想法 ,然后 再 看 代码 。 首 先 三 个 模块 分 别 作为 三 个 类 来 开 
发 : GUI 模块 类 接收 消息 模块 类 发送 消息 模块 类 。 最 后 合并 时 可 以 把 三 个 模块 分 别 存 储 
为 一 个 文件 ,然后 在 一 个 逻辑 代码 中 导 人 这 些 模块 ,下 面 的 做 法 是 把 三 个 模块 中 的 类 直接 
合并 到 一 个 程序 文件 MyChart0. 1. py 中 。 

通过 wxPython 实现 GUI 设计 。socket 编程 部 分 ,因为 在 前 面 介绍 了 socket 的 TCP 
传输 ,为 了 多 了 解 一 些 ,所 以 这 里 用 UDP 来 实现 ,主要 是 涉及 的 函数 方法 不 同 。 最 后 ,用 组 
播 地 址 的 办 法 实现 消息 发 送 (组 播 地 址 的 作用 是 ,你 向 这 个 地 址 发 送 消息 ,数据 会 发 到 局 域 
网 内 的 每 台 主 机 ,这 样 就 不 必 知 道 每 台 主 机 的 地 址 ,再 一 个 一 个 发 送 了 ) ,所 以 ,你 也 会 发 现 
我 们 的 程序 只 有 一 个 文件 ,并 没有 分 成 服务 端 和 客户 端 。 

下 面 是 整个 程序 各 个 组 成 部 分 的 代码 ,因为 要 做 讲解 ,所 以 做 了 比较 详细 的 注释 ,实际 
的 程序 不 需要 这 么 详细 ,做 好 关键 注释 就 好 。 

(1) 将 要 用 到 的 模块 依次 导入 ,主要 是 wxPython、threading、socket 等 。 


#MyChart0.1.py 
import wx 

import socket 
import threading 
import queue 
import time 
import random 
import string 


(2) 用 户 界面 模块 ,也 就 是 wxPython 实现 的 代码 。 


class MyChartFrame (wx.Frame): 
munGUI 模块 ww 
def init _(self, parent, title size = (640,480)) : 
"" "构造 函数 ,初始 化 主要 方法 """ 


wx.Frame. init _(self, parent, title = title, size = (640,480)) 


# 等 待 发 送 的 消息 的 队列 
self.sendMsgQueue = queue.Queue (200) 
# 生 成 将 要 给 消息 队列 上 的 锁 , 用 于 保证 同一 时 刻 只 有 一 个 线程 对 队列 操作 


self.sendMsgQueueLock = threading.Lock () 


self.initUI () 
self.bindEvent () 
self.startMsgThread () 
self.Show() 
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def 





initUI (self): 
seed = "0123456789" 
randomName = "".join (random.sample (seed, 8)) 


panel =wx.Panel (self) 
vbox = wx.BoxSizer (wx .VERTICAL) # 全 局 布局 管理 器 


# 聊 天 记录 组 件 及 布局 
self.tcMsgRA11 = wx.TextCtrl(panel， 
Style = wx.TE READONLY |wx.TE MULTILINE， 
size= (530, 300)) 
vbox.Add( (-1,15)) # 增 加 窗口 中 的 空白 空间 
Vbox.Add (self.tcMsgAl]l,proportion = 1， 
flag = wx.EXPAND|wx.LEFT |wx.RIGHT, border = 10) 


# 了 昵称 组 件 及 布局 


def 


StName = wx.StaticText (panel, label = "昵称 
self.tcName = WX.TextCtrl (panel) 
self.tcName .SetValue (randomName) 
hboxName = wx.BoxSizer (wx.HORIZONTAL) # 了 昵称 行 管理 器 
hboxName .Add (stName, 

flag = wxXx.RIGHT1wx.ALIGN_CENTER_VERTICRAL,border = 10) 
hboxName .Add (self.tcName， 

flag = Wwx.ALIGN CENTER VERTICAL) 
vbox.Add (hboxName, 

flag = wx.EXPAND|wx.LEFT |wx.RIGHT|wx.TOP, border = 20) 

vbox.add((-1,15)) # 增 加 窗口 中 的 空白 空间 


# 用 户 输入 内 容 的 文本 框 和 发 送 消息 的 按钮 
Self.tcMsgEnt = wxX.TextCtrl (panel, style = wx.TE MULTILINE, size = (500, 80)) 
self.btnSendMsg = wx .Button (panel, label = "发 送 ") 
hboxMsgEnt = wWX.BoxSizer (wx.HORIZONTAL) 
hboxMsgEnt .Add (self.tcMsgEnt, proportion = 1， 

flag = wx.EXPAND|wx .ALIGN CENTER VERTICAL|wx.RIGHT, border = 10) 
hboxMsgEnt .Add (self.btnSendMsg, 

flag = wx.EXPAND|wx .ALIGN CENTER VERTICAL|wx.RIGHT, border = 5) 
vbox.Add (hboxMsgEnt, flag = wx.EXPAND|wx.LEFT|wx.RIGHT, border = 15) 
vbox.Add((-1,15)) 


panel .SetSizer (vbox) # 启 动 布局 管理 器 
vbox.SetSizeHints (self) # 组 件 最 小 限制 
btnEvtSendMsg (self,evt): 


""" 按 钮 事件 处 理 """ 

n= self.tcName.GetValue() 

t=time.strftime("%Y- Sm- Sd %H:%M:%S", time.localtime (time.time())) 
m= self.tcMsgEnt .GetValue() 

msg="%s%s :\nss\n\n" S$(n, t,m) 

self.tcMsgEnt.Clear() 
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self.sendMsgQueueLock.acquire() # 获 取消 息 队 列 锁 
self.sendMsgQueue .put msg.encode ('utf8'))# 向 队列 放 和 人 数据 
self.sendMsgQueueLock.release() # 释 放 消 息 队 列 锁 


def bindEvent (self): 
""" 绑 定 发 送 按钮 事件 """ 
self.btnSendMsg.Bind (wx.EVT BUTTON, self.btnEvtSendMsg) 


def startMsgThread (self): 
""" 实 例 化 接收 和 发 送 消息 的 模块 ,并 启动 线程 """ 
self.recvMsgThread = RecvMsgThread (self) 
self .sendMsgThread = SendMsgThread (self.sendMsgQueue, self.sendMsgQueueLock) 
self.recvMsgThread.start () 
self.sendMsgThread.start () 


def RefreshTcMsgAll]l (self, msg): 
"mo 刷 新 聊天 记录 """ 
self.tcMsgAll .AppendText (msg) 


Gef del _(self): 
""" 析 构 函 数 , 程 序 结束 时 ,结束 线程 """ 
self.recvMsgThread.stop() 
self.sendMsgThread.stop () 
self.recvMsgThread.join() 
self.sendMsgThread.join() 


在 这 个 类 中 ,我 们 跟 另外 两 个 类 相关 联 的 就 是 通过 startMsgThread 将 另外 两 个 类 实例 
化 为 线程 。 因 为 收发 消息 都 会 对 队列 数据 进行 操作 ,所 以 在 收发 数据 时 都 要 对 队列 加 锁 。 
(3) 发 送 消息 的 代码 。 


class SendMsgThread (threading.Thread) : 
""" 消 息 发 送 模块 ""w 
def init _(self, sendMsgQueue, sendMsgQueueLock): 
threading.Thread. init _(self) 
self.threadName = "SendMsgThread" 
self.exitFlag = threading.Event () 


self.sendMsgQueue = sendMsgQueue 
self.sendMsgQueueLock = sendMsgQueueLock 


def run (self) : 
group ip = "224.1.1.1" # 组 播 地 址 
port = 8000 # 自 定义 端口 
print ("starting ", self.threadName) # 在 后 台 终 端 输出 


S = Socket .socket (socket .AF INET，socket.SOCK DGRAM, socket .IPPROTO UDP) 
Ss.setsockopt (socket .IPPROTO IP, socket.IP MULTICAST TTL, 32) 


A 
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# 监 视 消 息 队 列 ,一旦 有 消息 就 读 取消 息 并 发 送 , 直 到 线程 停止 
while not self.stopped() : 


self.sendMsgQueueLock.acquire() # 获 取 队 列 锁 
if not self.sendMsgQoueue .empty() : 
msg = self.sendMsgoueue.get() # 读 取 队 列 消息 


self.sendMsgQueueLock.release() # 取 得 消息 后 释放 队列 锁 
s.sendto(msg, (group ip, port)) 
print("%s sending $s" % (self.threadName, msg)) 
else: 
self.sendMsgQueueLock.release() 
time.sleep(1) 


s.close() 
print ("Exiting ", self.threadName) 


def stop (self) : 
Self.exitFlag.set() 


def stopped(self) : 
return self.exitFlag.isSet() 


发 送 消息 用 到 了 组 播 地 址 224. 1. 1. 1, 组 播 地 址 的 工作 方式 是 将 所 有 的 信息 接收 者 都 
加 入 一 个 组 内 ,并且 一 旦 加 入 之 后 ,流向 组 地 址 的 数据 立即 开始 向 接收 者 传输 ,组 中 的 所 有 
成 员 都 能 接收 到 数据 包 。 组 播 组 中 的 成 员 是 动态 的 ,主机 可 以 在 任何 时 刻 加 入 和 离开 组 播 
组 。 这 里 的 224. 1.1. 1 就 相当 于 向 局 域 网 的 所 有 主机 发 送 消息 。 

self. exitFlag 二 threading. Event() : threading. Event 机 制 类 似 于 一 个 线程 向 其 他 多 
个 线程 发 号 施 令 的 模式 ,其 他 线程 都 会 持 有 一 个 threading. Event 的 对 象 , 这 些 线程 都 会 
等 待 这 个 事件 的 “发 生 ”, 如 果 此 事件 一 直 不 发 生 , 那 么 这 些 线程 将 会 阻塞 ,直至 事件 的 
“发 生 ”。 

(4) 消息 接收 模块 。 


class RecvMsgThread (threading.Thread) : 
""" 清 息 接收 模块 ""w 
def init _(self, mainThread): 
threading.Thread. init _(self) 
self.threadName = "RecvMsgThread" 
self.mainThread = mainThread 
self.exitFlag = threading.Event () 


def run (self) : 
group ip = "224.0.0.1" 
Port = 8000 


Print("starting ", self .threadName) 
S = Socket .socket (socket .AF INET, socket.SOCK DGRAM, socket .IPPROTO UDP) 
Ss.setsockopt (socket.IPPROTO IP, socket.IP MULTICAST TTL, 32) 
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Ss.setsockopt (socket .IPPROTO IP, socket.IP MULTICAST LOOP, 1) 


s.bind(('', port)) 
host = socket .gethostbyname (socket .gethostname ()) 
Ss.setsockopt (socket .SOL IP, socket.IP MULTICAST IF, socket.inet aton(host)) 
Ss.setsockopt (socket .SOL IP, socket.IP ADD MEMBERSHIP, 
socket.inet aton(group ip) + socket .inet aton (host)) 


# 从 网 络 接收 消息 ,接收 到 消息 便 显 示 , 直 到 线程 被 停止 
while not self.stopped() : 
Ys 
msg, addr = s.recvfrom(1024) 
wx.CallAfter (self .mainThread.RefreshTcMsgAll, msg) 
except socket .error as e: 
print ("receiving expection") 
time.sleep(1) 


s.close() 
print ("Exiting ", self.threadName) 


def stopl(self): 
self.exitFlag.set() 


def stopped (self): 
return self.exitFlag.isSet () 


这 个 模块 主要 的 功能 就 是 socket 对 象 会 循环 的 从 8000 端口 接收 消息 ,然后 通过 wx. 
CallAfter(self. mainThread. RefreshTcMsgAll，msg) 调 用 GUI 模块 的 RefreshTcMsgAll 
方法 显示 消息 。 

(5) 最 后 的 逻辑 代码 只 要 启动 GUI 就 可 以 了 。 


Fb ,ed 
app = wx.App () 
frame = MyChartFrame (None, title = 'Milo 的 局 域 网 聊天 室 V0.1') 
frame.Show (True) 
app.MainLoop () 


至 此 ,你 的 局 域 网 聊天 室 就 可 以 使 用 了 。 如 果 你 是 重新 写 的 这 段 代码 ,很 可 能 会 有 编 
写 错误 、 拼 写 错误 等 问题 , 慢 慢 来 ,注意 看 报错 信息 。 最 终 效果 如 图 14-6 所 示 。 

这 个 聊天 室 只 是 聊天 功能 其 中 的 一 种 实现 方式 ,需求 不 同 就 会 产生 不 同 的 效果 ,比如 
你 还 可 以 加 上 文件 传输 的 功能 ,也 可 以 设计 一 个 服务 器 端 ,负责 跟 各 个 客户 端 连接 ,客户 端 
可 以 指定 昵称 来 收发 消息 等 。 


[ 硬 重点 提示 


在 这 一 章 中 ,你 要 掌握 的 内 容 : 
(1) 理解 urllib 等 网 络 应 用 模块 的 用 法 。 


A 
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夯 ; Milo 的 局域网 聊天 室 V0.1 口 





邹 琪 鲜 2018-05-02 14:38:28 : 
你 好 


milo 2018-05-02 14:38:52 : 
您 好， 邹 瑞 鲜 ， 什 么 事 ? 


小 明 2018-05-02 14:39:15 : 
没事 














昵称 | 小 明 
































14-6 ”运行 效果 图 


(2) 理解 socket 编程 的 核心 原理 。 
(3) 能 独立 设计 客户 端 /服务 端 模式 的 程序 。 


3 动 动手 


(1) 亲自 动手 完成 本 章 的 局 域 网 聊天 室 实 例 ,深入 理解 后 ,如 果 条 件 允许 (比如 你 懂 虚 
拟 机 ,或 者 你 有 局 域 网 ) 可 以 将 聊天 室 改 成 类 似 局 域 网 即时 通信 工具 ,用 户 可 以 指定 昵称 或 
IP 进行 聊天 。 

(2) 看 手册 及 手册 案例 了 解 socketserver, 如 果 不 太 明白 ,扫描 二 维 码 看 这 两 个 视频 吧 ， 
看 手册 了 解 socketserver 和 一 个 压缩 网 络 数据 的 小 案例 。 





看 手册 了 解 socketserver 压缩 网 络 数据 
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正则 表达 式 


正则 表达 式 (Regular Expression) 又 叫 正规 表示 法 ,主要 用 于 对 字 
符 串 进行 操作 。 正 则 表达 式 并 不 是 Python 特有 的 ,而 是 计算 机 科学 的 
一 个 概念 ,很 多 语言 都 支持 正则 表达 式 。 

在 编程 过 程 中 ,处 理 最 多 的 数据 类 型 就 是 字符 串 。 正 则 表达 式 是 
对 字符 串 操作 的 一 种 逻辑 公式 ,就 是 用 事先 定义 好 的 一 些 特定 字符 及 
这 些 特定 字符 的 组 合 ,组 成 一 个 “规则 字符 串 ”, 这 个 “规则 字符 串 ” 用 来 
表达 对 字符 串 的 一 种 过 滤 逻 辑 。 

很 多 时 候 都 需要 用 到 正则 表达 式 。 比 如 ,你 想 通过 程序 判断 一 个 字符 串 是 否 是 一 个 合 
格 的 E-mail 地 址 ,或 者 写 怜 虫 获得 了 一 个 网 页 的 源 代 码 , 然 后 要 从 大 篇 源 代码 过 滤 出 有 用 
的 数据 。 是 不 是 想 想 都 头疼 ? 但 这 些 问题 用 正则 表达 式 就 可 以 轻松 解决 。 


[>AEA 正则 表达 式 的 常用 字符 


如 果 你 接触 过 正则 表达 式 一 定 会 见 过 一 些 看 起 来 很 奇怪 的 字符 组 合 ,比如 “. 十 ? @. 
十 \. 十 ”等 。 在 正式 介绍 正则 表达 式 之 前 ,还 要 明确 一 点 ,通常 正则 表达 式 就 是 一 个 特殊 的 
字符 串 ,通过 工具 判断 某 个 待 判断 字符 串 是 否 符合 正则 表达 式 字符 串 所 代表 的 含义 。 所 以 
接 下 来 要 了 解 有 哪些 字符 用 来 组 成 正则 表达 式 。 

在 正则 表达 式 中 ,分 为 普通 字符 和 元 字符 两 种 。 

如 果 你 是 第 一 次 接触 正则 表达 式 , 可 以 先 利 用 一 些 比较 方便 的 方法 适应 一 下 ,比如 这 
个 在 线 的 网 站 http://rubular. com/( 见 图 15-1) 。 

在 这 个 在 线 网 站 中 直接 输入 正则 表达 式 和 待 匹配 字符 串 就 可 以 看 到 匹配 结果 。 这 对 
于 刚 开 始 熟悉 正则 表达 式 ,或 者 想 快速 验证 正则 表达 式 ,非常 方便 。 

15.11 普通 字符 

普通 字符 就 是 仅 代 表 自 己 , 没 有 特殊 含义 ,比如 字母 和 数字 。 如 果 正 则 表达 式 写 成 
abc, 则 只 有 abc 这 个 字符 串 符 合 这 个 正则 的 要 求 。 比 如 字符 串 vdgpythonsha, 我 想 知道 这 
一 串 字 符 串 中 是 否 有 python 这 个 单词 ,那么 ,就 可 以 使 用 python 作为 一 个 正则 表达 式 , 然 


后 将 vdgpythonsha 与 我 这 个 正则 表达 式 进行 相应 的 匹配 ,结果 是 其 中 含有 python。 这 时 的 
正则 表达 式 就 都 是 普通 字符 。 
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| C |o 苹 全 | rubularcom 


Rubular 


aRuby regular expression editor 


Your regular express 


our test String : Match result: 


clesarflelcs 


图 15-1 http://rubular.com/ 网 站 





但 有 时 可 能 要 做 一 些 模糊 匹配 ,比如 shjPythoniipython 这 个 字符 串 如 果 用 python 来 
匹配 ,因为 严格 区 分 大 小 写 的 原因 ,可 能 只 匹配 到 一 个 (说 “可 能 ”, 是 因为 正则 有 办 法 不 区 
分 大 小 写 , 下面 将 详细 介绍 ) 。 


15.12 


元 字符 


普通 字符 只 能 进行 严格 死板 的 匹配 。 在 正则 表达 式 中 可 以 通过 元 字符 来 完成 更 复 
杂 的 匹配 ,元 字符 是 正则 表达 式 中 具有 特定 含义 的 字符 ,常用 元 字符 及 功能 如 表 15-1 所 
示 。 你 可 以 把 正则 和 待 匹 配 的 字符 串 放 到 http://rubular. com/ 测 试 一 下 ,看 看 直观 的 
































在 () 中 , 则 它 的 范围 是 整个 正则 表达 式 








效果 。 
表 15-1 元 字符 
元 字符 含义 正 则 | 匹 配 
匹配 任意 除 换行 符 “\n” 外 的 字符 So ee 
(在 DOTALL 模式 中 也 能 匹配 换行 符 ) “ 
\ 转 义 字符 ,使 后 一 个 字符 改变 原来 的 意思 ,如 果 是 元 字符 则 变 成 普通 Re 本 
字符 
* “| 匹配 前 一 个 字符 0 或 多 次 abcx ab-abccc 
十 “| 匹配 前 一 个 字符 1 次 或 无 限 次 abc 十 abc-abccc 
匹配 前 一 个 字符 0 次 或 1 次 abc? ab;abc 
匹配 字符 串 开头 。 在 多 行 模式 中 匹配 每 一 行 的 开头 “abc abcxyz 
$ “| 匹配 字符 串 末 尾 , 在 多 行 模式 中 匹配 每 一 行 的 末尾 abc$ xyzabc 
| 或 。 匹 配 *| "左右 表达 式 任意 一 个 ,从 左 到 右 匹配 ,如 果 “*|” 没 有 包括 Salt boca 
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续 表 
元 字符 含义 正 则 | 匹 配 

{m} 匹 配 前 一 个 字符 m 次 ; {m,n} 匹 配 前 一 个 字符 m 至 n 次 ,车 省 略 

{} n, 则 匹配 m 至 无 限 次 ab{1,2}c abc abbc 
字符 集 。 对 应 的 位 置 可 以 是 字符 集中 任意 字符 。[“abc] 表 示 取 反 , 即 区 

[] | 非 abc。 所 有 特殊 字符 在 字符 集中 都 失去 其 原 有 的 特殊 含义 。 用 “\”|aLbcdje a 
反 斜 杠 转 义 恢复 特殊 字符 的 特殊 含义 ” 
被 括 起 来 的 表达 式 将 作为 分 组 ,从 表达 式 左 边 开始 每 遇 到 一 个 分 组 的 

oO 左 括号 “(”, 编 号 十 1 (abc) {2} abcabc 
分 组 表达 式 作为 一 个 整体 ,可 以 后 接 数量 词 。 表 达 式 中 的 “| ” 仅 在 该 |a(1231456)c |a456c 
组 中 有 效 。 分 组 等 用 法 很 多 ,可 以 通过 help(re) 查 看 详细 说 明 











元 字符 除了 单个 使 用 ,还 可 以 组 合 在 一 起 实现 更 复杂 的 匹配 ,比如 我 们 要 匹配 一 个 手 
机 号 码 是 不 是 移动 13 开头 号 段 ,就 需要 组 合 几 个 元 字符 。 

首先 限定 了 13 号 段 , 那 么 就 以 “13” 这 个 普通 字符 开始 。 第 三 位 移动 的 是 从 “4” 到 “9” 中 
的 一 个 ,就 可 以 用 [4-9] 来 表示 ,手机 号 一 共 是 11 位 ,从 第 四 位 到 第 十 一 位 的 8 个 数字 可 以 
是 “0” 到 “9” 的 任意 数字 组 合 , 可 以 用 [0-9]{8) 表 示 。 这 样 组 合 到 一 起 作为 一 个 正则 表达 式 ， 
如 图 15-2 所 示 。 


m3Ea= 9 10= 918) 


Your regular expression: 


Your test string : Match result 


13512345678 





15-2 ”效果 图 


还 有 一 个 问题 就 是 ,如 果 待 匹配 的 字符 串 不 是 “13? 开 头 ,比如 al3512345678x 这 样 的 字 
符 串 ,其 中 有 符合 的 部 分 ,也 会 匹配 成 功 ,所 以 可 以 加 上 限制 开头 的 “^”, 这 样 可 以 限定 为 以 
13 开头 。 同 理 ,11 位 号 码 之 后 还 有 其 他 字符 ,比如 字符 串 13512345678abc 也 是 可 以 匹配 
的 ,所 以 ,再 加 上 “$ ”限制 结尾 ,这 样 就 能 完全 匹配 11 位 了 ,最终 结果 如 图 15-3 所 示 。 


“13[4= 9] [0= 9]{8}$" 


匹配 数字 相对 简单 一 些 , 假 设 要 验证 一 个 字符 串 是 否 是 一 个 合法 的 E-mail 地 址 ,就 要 
稍 复杂 一 点 。 

还 是 要 先 确 定 E-mail 的 特征 ,虽然 没有 统一 的 邮箱 账号 格式 ,但 是 所 有 邮箱 都 符合 “名 
称 @ 域 名 ”的 规律 。 我 们 主要 是 根据 项 目 需要 进行 匹配 ,毕竟 现在 已 经 有 邮箱 支持 中 文 的 
E-mail 地 址 了 。 

例 : 只 允许 英文 字母 数字、 下划线 、 英 文句 号 ,以 及 中 划 线 组 成 。 如 zouqixian@gmail. 


com 或 zougixian-01@gmail. com. cn。 
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Your regular expression: 


No matches. 


Your regular expression: 


13[4-9] [0-9] {8}$ 
Your test string: Match result: 


h35123456 13512345678| 





图 15-3 匹配 对 比 图 


(1) 名 称 部 分 

26 个 大 小 写 英文 字母 .数字 .下 划 线 .中 划 线 表达 式 为 La-zA-Z0-9_-]。 

由 于 名 称 是 由 若干 个 字母 ,数字 .下 划 线 和 中 划 线 组 成 ,所 以 需要 用 到 十 表示 多 次 出 
现 , 得 出 邮件 名 称 表达 式 为 La-zA-Z0-9_-] 十 。 

(2) 域名 部 分 

一 般 域名 的 规律 为 LN 级 域名 ][ 三 级 域名 . ] 二 级 域名 . 顶级 域名 ,比如 gmail. com、 
gmail. . com. cn, 分 析 可 得 域名 类 似 “x .x .* .x*” 组 成 。 

“x¥x” 部 分 可 以 表示 为 [a-zA-Z0-9] 十 。 

“xx” 部 分 可 以 表示 为 \. [a-zA-Z0-9] 十 。 

多 个 “.xx” 可 以 表示 为 (\. [a-zA-Z0-9] 十 ) 十 。 

综 上 所 述 ,域名 部 分 可 以 表示 为 La-zA-Z0-9_-] 十 (\. [a-zA-20-9_-] 十 ) 十 。 

由 于 邮箱 的 基本 格式 为 “名 称 @ 域 名 ”, 需 要 使 用 “^” 匹 配 邮箱 的 开始 部 分 ,用 “$ ”匹配 
邮箱 结束 部 分 以 保证 邮箱 前 后 不 能 有 其 他 字符 ,所 以 最 终 邮 箱 的 正则 表达 式 如 下 : 


a 二 下 一 SU 9.= tela zrA= 20= 9 + (No la A=205 .90 ] TS 


你 可 能 发 现 经 常 出 现 类 似 a-z、0-9 这 样 的 字符 集 , 所 以 ,正则 中 有 一 些 有 用 的 预定 义 字 
符 集 ,举例 如 下 。 

\d: 匹配 一 个 数字 ,等 同 于 [0-9]。 

\D: 匹配 非 数字 ,等 同 于 [^0-9]。 

\s: 匹配 空白 ,如 果 带 有 re. ASCII, 则 匹配 \t\n\r\f\v 中 的 一 个 。 

\S: 匹配 非 空白 。 

\w: 匹配 大 小 写字 母 ,数字 和 下 划 线 ,等 同 于 La-zA-Z0-9_]( 注 意 包含 下 划 线 ) 。 

\W: 匹配 Unicode 非 大 小 写字 母 、 数 字 和 下 划 线 ,等 同 于 [^a-zA-Z0-9_]。 

这 样 一 来 ,上 面 的 正则 可 以 简化 为 


Ee EEC IN 
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如 果 是 中 文 的 名 字 怎 么 匹配 呢 ? 其 实 很 简单 ,匹配 中 文字 符 的 正则 表达 式 : [Lu4e00- 
u9fa5] ,如果 需 要 匹配 2 到 4 位 的 中 文 就 可 以 写成 Lu4e00-u9fa5]{2,4} 。 

正则 表达 式 还 有 很 多 规则 和 用 法 ,这 里 我 们 仅 通 过 一 些 演示 来 让 你 快速 入门 。 正 则 其 
实 并 不 难 , 了 解 每 个 符号 的 意思 后 ,自己 动手 试 一 试 , 多 写 几 次 就 明白 了 ,正则 是 出 了 名 的 
坑 多 , 少 写 了 个 点 就 匹配 不 到 数据 了 ,多 练 多 试 , 慢 慢 就 好 了 。 


(> 有 EN Python 中 的 re 模块 
大 致 了 解 了 正则 表达 式 的 写法 和 规则 后 ,如 何在 Python 中 通过 正则 表达 式 处 理 字符 
串 呢 ? 
Python 中 提供 了 一 个 re 模块 ,用 来 支持 正则 表达 式 ,re 模块 中 提供 了 丰富 的 函数 和 相 
应 的 参数 。 


全 .2.1 正则 表达 式 主要 功能 


正则 表达 式 处 理 字符 串 主 要 有 以 下 四 大 功能 。 

(1) 匹配 : 查看 一 个 字符 串 是 否 符合 正则 表达 式 的 语法 ,一 般 返 回 true 或 者 false。 
(2) 获取 : 正则 表达 式 来 提取 字符 串 中 符合 要 求 的 文本 。 

(3) 替换 : 查找 字符 串 中 符合 正则 表达 式 的 文本 ,并 用 相应 的 字符 串 替 换 。 

(4) 分 割 : 使 用 正则 表达 式 对 字符 串 进 行 分 割 。 


15.22 re 模块 使 用 的 两 种 形式 


Python 中 的 re 模块 使 用 正则 表达 式 有 两 种 形式 。 
一 种 是 直接 通过 模块 调用 函数 进行 操作 ,通常 第 一 个 参数 是 正则 表达 式 字符 串 , 然 后 
是 待 匹配 的 内 容 , 此 种 方法 适合 只 使 用 一 次 的 正则 表达 式 。 比 如 : 


>>>re.findall (r"^13[4- 9] [0- 9] {8}$","13512345678") 


另 一 种 是 使 用 re. compile(r, f) 方 法 生成 正则 表达 式 对 象 ,然后 调用 正则 表达 式 对 象 的 
相应 方法 。 这 种 做 法 的 好 处 是 生成 正则 对 象 之 后 可 以 多 次 使 用 。 比 如 : 


>>>rx = re.compile(rn^13[4-9] [0- 9] {8}$") 
>>>rx.findall ("13512345678") 


可 能 你 注意 到 了 定义 正则 字符 串 前 的 r, 需 要 说 明 一 下 。 正 则 表达 式 通 过 “\” 作 为 转 义 
字符 ,比如 “\n” 表 示 换 行 ,但 有 时 我 们 就 是 要 匹配 “\n” 这 两 个 字符 ,你 可 以 这 样 表 示 “\\n”， 
如 果 有 多 个 类 似 的 符号 就 会 看 起 来 比较 乱 , 也 不 易 读 , 所 以 ,这 时 可 以 在 字符 串 前 加 ,代表 
这 是 一 个 原生 字符 串 ,其 中 的 转 义 字符 不 转 义 。 


15.2.3 re 常用 函数 及 方法 
re 模块 包含 的 内 容 非常 多 ,建议 你 通过 help(re) 查 看 详细 说 明 。 


A 
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1 re.compile() 


编译 正则 表达 式 ,返回 一 个 对 象 的 模式 (可 以 把 常用 的 正则 表达 式 编译 成 正则 表达 式 
对 象 ,提高 效率 ) 。 
函数 语法 为 


re .compile (Pattern,flags = 0) 


pattern: 编译 时 用 的 表达 式 字 符 串 。 
flags: 编译 标志 位 ,用 于 修改 正则 表达 式 的 匹配 方式 ,如 是 否 区 分 大 小 写 、 多 行 匹配 等 。 
flags 在 其 他 函数 中 都 是 通用 的 ,我们 分 开 在 几 个 函数 中 举例 ,常用 的 flags 见 表 15-2 所 示 。 
表 15-2 常用 的 flags 























标 志 含义 
re. S(DOTALL) 使 匹配 包括 换行 在 内 的 所 有 字符 
re. I(IGNORECASE) 使 匹配 对 大 小 写 不 敏感 
re. L(LOCALE) 作 本 地 化 识别 (locale-aware) 匹 配 
re. MMULTILINE) 多 行 匹配 ,影响 ^ 和 $ 
re. X(VERBOSE) 该 标志 通过 给 予 更 灵活 的 格式 以 便 将 正则 表达 式 写 得 更 易于 理解 
re.U 根据 Unicode 字符 集 解 析 字 符 ,这 个 标志 影响 \w,\W,\b,\B 
用 法 如 下 : 
>>>import re # 导 入 模块 


# 生 成 正则 对 象 ,匹配 单词 python, 不 区 分 大 小 写 

>>>rx = re.compile(r'python',re.I) 

>>>rx.findall ("python Python Jython") # 调 用 findall 方法 匹配 字符 串 s 
['python', 'Python'] # 返 回 结果 

2. re.findall() 


遍历 匹配 ,可 以 获取 字符 串 中 所 有 匹配 的 字符 串 , 返 回 一 个 列表 ,如 果 有 分 组 , 则 返回 
分 组 内 容 。 
函数 语法 为 


re.findall (pattern, string, flags = 0) 


前 面 我 们 说 过 ,除了 编译 过 的 正则 对 象 ,这 些 函 数 也 可 以 被 直接 调用 ,上 面 的 例子 也 可 
以 是 这 样 : 


>>>re.findall (r'python', "python Python Jython", re.I) 
['python', 'Python'] 


3. re.sub() 
使 用 re 替换 string 中 每 一 个 匹配 的 子 串 后 返回 替换 后 的 字符 串 。 
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语法 格式 为 


re.sub(pattern, repl, string, count) 


re. sub 还 允许 使 用 函数 对 匹配 项 的 替换 进行 复杂 处 理 。 下 面 我 们 用 两 种 方法 分 别 将 
字符 串 中 的 空格 替换 为 ”和 "“[]”。 用 法 如 下 : 


>>>import re 

>>>text = "I am milo,how are you!" 

>>>re.subl(r'\st', '-', text) 

'I- am- milovhow-are-Yyoul! 

>>>re.subl(r'\st', lambda m:'['+m.group (0)+']', text,0) 
'I[ Jam[ ]milo,how[ ]are[ Jyou!' 


4. re.match 


re. match 尝试 从 字符 串 的 起 始 位 置 匹配 一 个 模式 ,如 果 不 是 起 始 位 置 匹配 成 功 ,match() 
就 返回 none。 
函数 语法 为 


re.match(pattern, string, flags = 0) 


用 法 如 下 : 


>>>import re 

>>>print (re.match('www', 'www.abcdefg.com').span()) 
(0, 3) 

>>>print (re.match('com', 'www.abcdefg.com')) 

None 


5. re.search 


re. search 扫描 整个 字符 串 并 返回 第 一 个 成 功 的 匹配 。 
函数 语法 为 

re .Search (pattern, string, flags = 0) 

用 法 如 下 : 

>>>import re 

>>>print (re.search('www', 'www.abcdefg.com').span()) 
(0, 3) 


>>>print (re.search('com'，'www.abcdefg.com').span()) 
(27 5) 


6. match object 对 象 方法 
match 和 search 一 旦 匹配 成 功 ,就 是 一 个 match object 对 象 ,而 match object 对 象 有 以 
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下 法 法 ;。 

(1) group() : 返回 被 正则 匹配 的 字符 串 。 

(2) start(): 返回 匹配 开始 的 位 置 。 

(3) end(): 返回 匹配 结束 的 位 置 。 

(4) span(): 返回 一 个 元 组 包含 匹配 (开始 ,结束 ) 的 位 置 。 

(5) group(): 返回 与 正则 整体 匹配 的 字符 串 , 可 以 一 次 输入 多 个 组 号 ,对 应 组 号 匹配 
的 字符 串 。 

(6) groupdict(): 以 字典 形式 返回 正则 分 组 匹配 的 字符 串 ,组 名 为 key。 


[> 有 BE 实例 : 一 只 小 把 虫 


正则 表达 式 是 疏 虫 利器 ,学 会 正则 ,不 写 怜 虫 真 是 浪费 。 不 管 多 少 语法 讲解 都 不 如 实 
战 来 得 直观 ,下 面 我 们 就 来 实现 一 个 简单 的 小 疏 虫 ,看 一 下 疏 虫 基本 的 工作 原理 ,算是 一 个 
入 门 的 项 门 砖 ,要 想 完成 更 复杂 的 候 虫 ,还 要 多 用 些 心 才 行 。 

网 络 息 虫 是 一 种 按照 一 定 的 规则 ,自动 抓 取 万 维 网 信息 的 程序 或 者 脚本 。 扑 虫 的 基本 
工作 有 四 步 。 

(1) 明确 目标 : 要 知道 你 准备 在 哪个 范围 或 者 网 站 去 搜索 什么 样 的 数据 。 

(2) 疏 : 将 所 有 网 站 的 内 容 全 部 息 下 来 。 

(3) 过 滤 : 去 掉 对 我 们 没 用 处 的 数据 。 

(4) 处 理 数据 : 按照 我 们 想 要 的 方式 存储 和 使 用 。 

现在 就 可 以 先 定 一 些 目标 ,比如 我 们 可 以 怜 取 中 国 天 气 网 未 来 一 周全 国 省 会 城市 的 天 
气 , 或 者 很 多 人 喜欢 疏 豆 辩 的 影评 等 ,这 里 我 们 把 目标 定 的 具体 直观 一 些 , 比 如 我 们 就 怜 取 
粮 事 百科 热 图 首页 的 段子 图 片 ,并 且 保存 到 本 地 。 

基本 的 过 程 如 下 。 

(1) 先 分 析 网 页 中 图 片 的 地 址 特征 。 

(2) 将 页 面 源 代码 全 部 抓 取 过 来 。 

(3) 通过 正则 表达 式 匹 配 出 所 有 图 片 的 地 址 。 

(4) 下 载 保 存 到 本 地 。 

具体 实施 的 过 程 如 下 。 


1. 分 析 


首先 分 析 网 页 ,打开 https://www. qiushibaike. com/imgrank/, 可 以 看 到 普通 的 网 页 ， 
我 们 需要 的 是 在 网 页 的 源 代码 中 找到 图 片 的 地 址 ,可 以 通过 在 浏览 器 中 按 F12 键 看 到 源 代 
码 , 如 果 你 用 Chrom ,也 可 以 选中 一 个 图 片 然后 右 击 选择 检查 ,可 以 直接 看 到 图 片 的 代码 部 
分 ,如 图 15-4 所 示 。 

我 们 看 见 图 15-5 中 的 代码 ,如 果 你 查看 过 多 个 图 片 的 源 代码 ,就 会 发 现 相同 的 要 素 , 整 
个 图 片 都 是 包含 在 <a><</a>(CHTML 语言 ) 标 签 中 的 ,这 也 是 我 们 获取 的 关键 数据 ,因为 
src 一 后 面 第 一 个 引号 中 的 地 址 就 是 图 片 实际 的 地 址 。 
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图 15-4 源 代码 


Pedlv class= authon cleantlX Yc/d1V> 

<a href-"/article/129353217" target-"_blank” class-"contentHerf” onclick= 
”_hmt.push(["_trackEvent' "web-list-content’, chick"])">..c/a> 

<1-- 图 片 或 gif --> 





Vca href-"/article/129353217” target-"_blank"» 

img snc™"//pic.qiushibaike. com/system/pictures/12935/120353217/medium/ 
appl126353217.,jpeg”alt-"* 粮 事 #126353217”c1ass="illustration”width="196X” 
heieght-"auto"》== £0 





"stats" cjdiv> 

<div id="qiushi_counts_126353217”c1ass="stat5-buttons bar clearfix">..¢/div> 
ingle-share">-c/divy 

inRgle-clear">c/divy> 


图 15-5 图 片 源 代码 








2. 下 载 源 代码 


明白 了 第 一 步 的 目标 , 接 下 来 就 是 获取 整个 网 页 的 源 代码 了 。 我 们 在 网 络 编程 的 章节 
介绍 过 urllib。 所 以 ,按照 之 前 学 习 的 内 容 可 以 很 容易 写 出 这 样 的 代码 获取 网 页 源 代码 : 


from urllib import request 
url = "http://www.qiushibaike.com/imgrank/" 
response = request .urlopen (Url1) 


这 时 你 可 能 会 看 到 下 面 这 样 的 报错 : 


File 
"C:/Users/milo/Desktop/CrazyPythonZeroToHero/code/15/getImgQB .py", line 4, in 


<module> 
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response =Urllib.request.urlopen(url) 
File 
"C:\Users\milo\AppData\Local\Programs \Python\Python36- 32\lib\urllib\request. 
py", line 223, in urlopen 
return opener .open (url, data, timeout)... 


这 是 因为 有 些 网 站 为 了 防止 被 仆 虫 仆 取 信息 而 设置 的 一 个 验证 , 即 网 站 的 UA 防护 ， 
一 般 网 站 都 要 检查 是 否 是 浏览 器 在 进行 访问 ,所 以 我 们 这 里 的 方式 就 是 设置 请 求 头 ,让 网 
站 以 为 是 一 个 浏览 器 再 访问 ,下 面 我 们 加 上 请 求 头 再 通过 urlopen 打开 网 页 并 读 取 源 代码 。 


#getImgQB .py 
from urllib import request 


Url = "http://www.qiushibaike.com/imgrank/" 
user agent = 'Chrome/4.0 (compatible; MSIE 5.5; Windows NT) 
req = request.Request (url,headers={ 
'User-Agent': 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)' 
]) 
response = request .urlopen (req) 
html = response.read () .decode ('utf-8') 
print (html) 


这 时 你 会 看 到 shell 中 显示 的 源 代码 ,但 是 这 没 用 , 接 下 来 才 是 关键 , 即 我 们 要 针对 第 
一 步 分 析 的 结果 ,编写 正则 表达 式 。 


3. 过 滤 


获取 到 原始 数据 的 下 一 步 就 是 对 数据 进行 过 滤 , 得 到 有 效 的 信息 ,我 们 的 目标 是 源 代 
码 中 带 下 划 线 的 部 分 ,也 就 是 图 片 地 址 : 


<a href = "/article/120353217" target =" blank"> 

<img src ="//pic.qiushibaike.com/system/pictures/12035/120353217/medium/ 
app120353217.jpeg" alt = " 粮 事 #120353217" class = "illustration" width = "100%" 
height = "auto"> 

</a> 





此 时 编写 正则 的 方式 也 并 不 是 唯一 的 , 尽 可 能 精确 地 匹配 这 个 字符 串 ,匹配 的 规矩 要 
多 一 些 ,否则 你 很 可 能 会 匹配 到 一 些 没 用 的 图 片 ,比如 头像 .背景 等 。 

如 果 用 口语 描述 这 个 地 址 ,我 们 可 以 说 图 片 地 址 位 于 “一 a 空格 十 一 堆 字符 十 二 十 换行 十 
二 img 十 huanhang 十 src 一 ?后面 的 第 一 个 引号 中 ,同时 后 面 还 有 一 堆 字 符 直 到 “一 /a>>”。 
所 以 最 终 得 出 了 下 面 这 样 一 个 正则 : 





re.compile('<a.* ?>\n<img src="(.*?)".*?>') 


可 能 你 已 经 注意 到 了 “x* ”和 “?” 的 组 合 ,这 涉及 正则 匹配 的 模式 ,试想 <a. ”后 面 的 星 
号 ,如 果 没 有 那个 问号 ,会 向 后 无 限 匹配 ,直到 最 后 一 个 “二 ” 才 结 束 ,这 样 ,后 面 的 表达 式 其 
实 根 本 就 没 用 ,也 不 会 得 到 想 要 的 结果 了 ,而 这 里 要 的 仅仅 是 “~<a. ”之 后 一 堆 字 符 后 的 第 
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一 个 “二 ”, 所 以 加 了 “?”, 单 独 的 “?” 代 表 匹 配 前 一 字符 0 或 1 次。 而 跟 ** ”十 ”组 合 使 用 ， 
则 代表 非 贪 禁 模式 , 作 最 小 匹配 。 这 个 地 方 需要 好 好 理解 一 下 ,可 以 在 终端 多 试 试 ,体会 
= 

注意 : 贪 禁 模式 指 在 整个 表达 式 匹 配 成 功 的 前 提 下 , 尽 可 能 多 地 匹配 ( * )。 

非 贪 禁 模 式 指 在 整个 表达 式 匹配 成 功 的 前 提 下 , 尽 可 能 少 地 匹配 ( ? )。 

Python 默认 是 贪 禁 模式 。 

另外 ,我 们 将 图 片 地 址 部 分 的 匹配 用 “(Oy)” 作 了 一 个 分 组 ,这 样 我 们 在 匹配 后 只 要 返回 
分 组 数据 就 可 以 得 到 图 片 地 址 了 ,可 以 先 打印 到 屏幕 上 。 


#getImgQB .py 
from urllib import request 
import re 


Url = "http://www.qiushibaike.com/imgrank/" 
user agent = 'Chrome/4.0 (compatible; MSIE 5.5; Windows NT)' 
req = request.Request (url, headers={ 
'User- Agent': 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)' 
}) 
response = request .urlopen (req) 
html = response.read() .decode ('utf-8') 
PatternImg = re.compile('<a.* ?>\n<img src="(.*?3)".#*?>') 
items = re.findall (patternImg, html) 


for item in items: 
print (item) 


结果 如 下 : 


>>> 
//pic.qiushibaike.com/system/pictures/12035/120354571/medium/app120354571.jpeg 
//pic.qiushibaike.com/system/pictures/12035/120351986/medium/app120351986.jpg 


//pic.qiushibaike.com/system/pictures/11692/116921877/medium/app116921877.JPEG 
//static. qiushibaike. com/images/web _ v3/sidebar/remix _ banner. gif? v = 
f8bbbe7Tca7cd5b9314e8235d6290fb0f 


我 们 看 到 这 个 结果 最 后 有 一 条 规则 的 字符 串 ,符合 规则 的 图 片 后 缀 名 也 是 分 成 了 jpeg 
与 jpg 两 种 ,还 有 大 、 小 写 的 区 别 , 所 以 最 后 再 对 数据 作 一 次 过 滤 , 只 留 下 有 用 的 图 片 地 址 ， 
并 且 利 用 urllib 直接 下 载 图 片 文件 ,文件 名 用 自 定义 的 递增 数字 表示 。 

最 终 的 代码 封装 了 两 个 函数 ,就 像 下 面 这 样 : 

#getImgQB .py 

from urllib import request 


import re 


url = "http://www.qiushibaike.com/imgrank/" 
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user _ agent = 'Chrome/4.0 (compatible; MSIE 5.5; Windows NT) " 


def getHtml (ur1) : 
req = request.Request (url, headers = {'User-Agent':user agent}) 
response = request .urlopen (req) 
html = response.read () .decode ('utf-8') 
#print (html) # 测 试 代码 
response.close() 
return html 


def getImg (html): 
PatternImg = re.compile('<a.* ?>\n<img src="(.*?3)".x*?>') 
jpglist = re.findall (patternImg，html) 
i=0 
for item in jpglist: 
patternJpeg = re.compile('.*\.jpe{0,1}g', re.I) 
#print (patternJpeg.findall (item)) # 测 试 代码 
if patternJpeg.findall (item) : 


#print ("http:"+item) # 测 试 代 码 
# 异 常 处 理 作 用 是 防止 无 效 地 址 导致 下 载 失败 
Cy 


request .urlretrieve ("http:"+ 
patternJpeg.findall (item) [0], 
"gd.jpg" $i) 
except: 
pass 
1i+=1 


html = getHtml (ur1) 
getImg (html) 


在 过 程 中 ,我 们 可 以 用 一 些 print 语句 来 随时 观察 匹配 的 结果 ,根据 结果 作 些 调整 ,只 
要 保持 思路 清晰 ,基本 上 是 不 会 有 什么 问题 的 。 
运行 后 ,就 会 在 你 的 脚本 所 在 路 径 看 到 下 载 的 图 片 了 ( 见 图 15-6) 。 














》 此 电脑 》 本 地 厂 盘 (C:) > Users > milo > Desktop > CrazyPythonZeroToHero > code > 15 

回 ojpg 回 7jpg 回 14jpg 回 21jpg 

加 1jpg 回 sjpg 回 15jpg 回 22jpg 

回 zjpg 回 9jpq 回 16jpg 回 23jpg 

回 3jp9 回 1ojpq 回 17jpg 回 24jpg 

回 4jpg 回 11jpg 回 18jpg 画 oeumoQqs.py 

回 5jpg 回 12jpg 回 19jpg 画 ob.py 

回 6jpq 加 13jpg 加 2ojpg 帮 -eg download jpg.py 

图 15-6 ”看 虫 效 果 


最 后 需要 说 明 的 是 ,这 只 是 一 个 基本 的 聆 虫 。 实 际 情况 可 能 要 复杂 ,工作 量 也 会 比较 
大 。 比 如 ,你 要 疏 取 整个 网 站 ,就 需要 深入 了 解 怜 虫 工作 原理 ,要 学 会 使 用 基本 的 http 抓 取 
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工具 scrapy 以 及 分 布 式 怜 虫 等 一 系列 的 概念 和 工具 。 其 实 技术 就 是 一 层 纸 , 现 在 点 透 了 ， 
想 要 深入 学 习 就 会 比较 快 了 。 


| 哩 重点 提示 


在 这 一 章 中 ,你 要 掌握 的 内 容 : 
(1) 理解 正则 表达 式 的 作用 。 
(2) 掌握 元 字符 的 意义 和 用 法 。 
(3) 熟悉 re 模块 及 常用 方法 。 


和 动 动手 
(1) 仿照 本 章 案例 写 一 个 小 候 虫 来 仆 取 你 感 兴趣 的 信息 。 
(2) 在 第 6 章 的 动 动手 中 ,apache 日 志 的 空格 解析 了 一 次 apache 


日 志 , 现 在 我 们 用 正则 的 方式 再 来 解析 一 次 , 感 兴趣 的 话 , 可 以 扫描 雳 oe 
边 的 二 维 码 观看 视频 。 apache 日 志 ， 


(3) 通过 多 线程 的 方式 ,直接 爬 取 粮 事 百科 文字 的 前 十 页 ,每 页 一 个 线程 。 
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第 16 对 
”小 白 也 玩 大 数据 


对 于 大 数据 (Big Data) ,研究 机 构 Gartner 给 出 了 这 样 的 定义 : 大 数据 是 需要 新 处 理 模 
式 才能 具有 更 强 的 决策 力 ,洞察 发 现 力 和 流程 优化 能 力 来 适应 海量 、 高 增长 率 和 多 样 化 的 
信息 资产 。 

大 概 2012 年 以 后 ,大 数据 这 个 词 可 以 说 是 越 来 越 热门 ,也 被 更 多 的 人 所 知晓 。 但 其 实 
大 数据 概念 由 来 已 久 ,最早 提 出 “大 数据 ?时 代 到 来 的 是 全 球 知名 咨询 公司 麦肯锡 ,麦肯锡 
称 :“ 数 据 , 已 经 渗透 到 当今 每 一 个 行业 和 业务 智能 领域 ,成 为 重要 的 生产 因素 。 人 们 对 于 
海量 数据 的 挖掘 和 运用 ,预示 着 新 一 波 生 产 率 增 长 和 消费 者 盈余 浪潮 的 到 来 . 

“大 数据 ?在 物理 学 .生物 学 、 环 境 生态 学 等 领域 以 及 军事 .金融 .通信 等 行业 存在 已 久 ， 
之 所 以 近年 来 引起 人 们 关注 ,还 得 益 于 互联 网 和 信息 行业 的 发 展 。 

大 数据 涉及 的 技术 很 多 ,在 这 一 章 , 我 们 会 对 大 数据 有 一 个 基本 的 了 解 ,并 且 通 过 
Python 实现 一 个 大 数据 的 小 模型 。 


> 好 玩 的 大 数据 


生活 中 经 常 看 到 大 数据 的 影子 ,而 且 通常 都 会 让 人 觉得 很 神奇 。 比 如 根据 你 的 浏览 记 
录 推 送 你 感 兴趣 的 信息 ,或 者 在 2017 年 年 底 , 很 多 APP 都 放出 了 类 似 个 人 一 年 的 历程 , 比 
如 支付 宝根 据 个 人 消费 记录 统计 出 了 若干 条 消费 习惯 ,总 结 出 了 你 是 不 是 “高 富 帅 ”一 类 
的 。 还 有 网 易 云 音乐 也 根据 你 听 歌 的 时 间 和 歌曲 的 类 型 ,统计 出 你 是 不 是 有 一 个 夜半 听 歌 
的 孤独 灵魂 。 

还 有 很 多 有 趣 的 大 数据 案例 ,我 们 稍微 了 解 一 点 。 

(1) 一 个 淘宝 数据 平台 的 分 析 提 到 ,全 国 购买 文胸 最 多 的 号 码 是 B 罩杯 ,比例 占 比 达 
41.45% ,其 中 又 以 75B 的 销量 最 好 ;黑色 最 畅销 。 

(2) 沃尔玛 经 过 对 用 户 购 物 数据 分 析 , 男 性 顾客 买 了 婴儿 尿布 后 ,很 多 会 顺手 带 几 瓶 啤 
酒 ,所 以 沃尔玛 尝试 将 婴儿 尿布 和 啤酒 摆 在 一 个 区 域 ,结果 尿布 和 啤酒 的 销量 都 大 幅 增 加 。 
如 今 , “尿布 ”十 “啤酒 ”的 数据 分 析 结 果 早已 成 了 大 数据 技术 应 用 的 经 典 案例 。 

(3) 之 前 提 到 过 ,大 数据 由 来 已 久 , 可 能 你 想不到 的 是 ,在 战争 中 也 有 过 大 数据 的 成 功 
应 用 。 将 军 随身 笔记 本 上 面 记载 着 每 次 战斗 的 缴获 、 歼 敌 数 量 。 某 次 非常 小 的 战役 后 ,将 
军 发 现 三 个 问题 : 

@ 缴获 的 短 枪 与 长 枪 的 比例 比 其 他 战役 略 高 ; 
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@ 缴获 和 击毁 的 小 车 与 大 车 的 比例 比 其 他 战役 略 高 ; 

@ 俘虏 和 击毙 的 军官 与 士兵 的 比例 比 其 他 战役 略 高 。 

呢 , 这 有 什么 用 ? 将 军 在 这 次 战役 的 数据 启发 下 ,判断 出 这 是 对 手 的 指挥 所 ,成 功 地 抓 
获 了 敌 方 将 领 。 

看 完 这 三 个 小 故事 ,要 说 的 是 ,大 数据 技术 的 战略 意义 不 在 于 掌握 庞大 的 数据 信息 ,而 
在 于 对 这 些 含有 意义 的 数据 进行 专业 化 处 理 。 换 而 言 之 ,如 果 把 大 数据 比 作 一 种 产业 , 那 
么 这 种 产业 实现 一 利 的 关键 在 于 提高 对 数据 的 “加 工 能 力 ”, 通 过 “加 工 ” 实 现 数据 的 
“增值 ”。 


sr 大 数据 技术 


了 解 大 数据 ,首先 要 搞 清楚 大 数据 能 做 些 什 么 、 怎 么 做 。 

要 介绍 大 数据 就 要 提 到 云 计 算 , 从 技术 上 看 ,大 数据 与 云 计算 的 关系 就 像 一 枚 硬币 的 
正 \ 反 面 一 样 密 不 可 分 。 大 数据 必然 无 法 用 单 台 计算 机 进行 处 理 ,必须 采用 分 布 式 架构 。 
它 的 特色 在 于 对 海量 数据 进行 分 布 式 数 据 挖掘 。 它 必须 依托 云 计算 的 分 布 式 处 理 、 分 布 式 
数据 库 和 云 存储 、 虚 拟 化 技术 。 也 可 以 说 正 是 因为 有 了 云 计算 的 快速 发 展 , 才 推 动 了 大 数 
据 的 应 用 。 

大 数据 的 总 体 架构 包括 三 层 ; 数据 存储 、 数 据 处 理 和 数据 分 析 。 数 据 先 要 通过 存储 层 
存储 下 来 ,然后 根据 数据 需求 和 目标 建立 相应 的 数据 模型 和 数据 分 析 指 标 体系 对 数据 进行 
分 析 产 生 价 值 。 

再 具体 细 分 大 数据 的 生态 圈 , 涵 盖 的 范围 就 更 广 了 ,其 中 最 出 名 的 就 是 Hadoop 了 ， 
Hadoop 生态 圈 或 者 由 其 延伸 的 泛 生态 系统 ,基本 上 都 是 为 了 处 理 大 量 数据 诞生 的 。 

大 数据 这 个 圈子 里 的 工具 就 好 像 家 里 的 各 种 家 具 和 物品 ,各 自 有 各 自 的 功能 ,可 以 相 
互 配合 ,也 可 能 有 功能 重合 的 ,比如 冰箱 可 以 放 东 西 ,衣柜 也 可 以 放 东 西 ,但 是 你 把 白菜 放 
在 衣柜 就 发 挥 不 出 衣柜 的 作用 ; 碗 可 以 盛 汤 ,浴缸 也 可 以 盛 汤 ,但 用 浴缸 喝 汤 是 不 合理 的 。 
所 以 ,在 大 数据 领域 ,并 不 是 标新立异 的 好 地 方 , 即 使 你 强行 要 创造 一 些 奇异 的 组 合 , 即 使 
最 终 完 成 工作 ,也 不 一 定 是 最 快 .最 好 的 选择 。 

对 传统 的 单机 文件 系统 来 说 , 横 跨 不 同 机 器 几乎 是 不 可 能 完成 的 任务 。 而 通过 HDFS 
(Hadoop Distributed FileSystem) ,你 可 以 通过 横 跨 上 千 甚至 上 万 台 机 器 来 完成 大 量 数据 
的 存储 ,同时 这 些 数 据 全 部 都 能 归属 在 同一 个 文件 系统 之 下 。 

过 于 庞大 的 数据 ,如 果 只 交 给 一 台 机 器 处 理 , 我 们 可 能 得 等 上 几 周 甚至 更 长 时 间 。 以 工 
甚至 P 来 计量 单位 的 数据 , 若 只 靠 一 台 机 器 ,可 能 等 不 到 结果 。 

所 以 使 用 大 量 机 器 进行 处 理 是 必然 的 选择 。 在 大 量 机 器 处 理 过 程 中 ,必须 处 理 一 些 事 
务 : 任务 分 配 、 紧 急 情 况 处 理 、 信 息 互 通 等 ,这 时 候 必须 引入 MapReduce/Tez/Spark。 其 
中 ,前 者 可 以 成 为 计算 引擎 的 第 一 代 产 品 , 后 两 者 则 是 经 过 优化 后 的 下 一 代 。MapReduce 
采用 了 非常 简单 的 计算 模型 设计 ,可 以 说 只 用 了 两 个 计算 的 处 理 过 程 ,但 是 这 个 工具 已 经 
足够 应 付 大 部 分 的 大 数据 工作 了 。 
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MapReduce 模型 


Hadoop 本 身 是 使 用 Java 实现 的 ,所 以 ,最 直接 的 开发 就 是 用 Java 语言 。 但 是 对 于 不 
懂 Java 语言 的 开发 人 员 ,这 又 提高 了 学 习 成 本 。 好 在 Hadoop 提供 了 Python 接口 ,我 们 可 
以 以 更 低 的 学 习 成 本 来 使 用 Hadoop。 

Hadoop 中 的 经 典 模型 MapReduce,Python 也 有 这 两 个 函数 ,而 且 作 用 相仿 。MapReduce 
模型 其 实 就 是 分 成 Map( 映 射 ) 和 Reduce( 规 约 ) 两 部 分 合作 。 比 如 要 统计 一 个 巨大 的 存储 
在 类 似 HDFS 上 的 文本 文件 ,你 想 知道 这 个 文本 里 各 个 词 的 出 现 频率 。 启 动 一 个 
MapReduce 程序 后 ,Map 部 分 通过 几 百 台 机 器 同时 读 取 这 个 文件 的 各 个 部 分 ,分 别 把 各 自 
读 到 的 部 分 统计 出 词 频 ,这 几 百 台 机 器 各 自 产 生 一 个 结果 ,然后 又 有 几 百 台 机 器 启动 
Reduce 处 理 , 这 些 Reduce 将 结果 汇总 ,你 就 得 到 了 整个 文件 的 词 频 结果 。 

我 们 在 后 面 的 案例 中 就 通过 Python 手动 实现 这 个 MapReduce 模型 ,以 此 作为 了 解 大 
数据 的 途径 。 因 为 用 Hadoop 框架 实现 分 布 式 的 大 数据 模型 需要 先 搭建 配置 Hadoop 环 
境 , 还 需要 虚拟 机 ,这 些 已 经 远 远 超过 “一 个 章节 玩 大 数据 ”的 范围 了 ,所 以 我 们 将 模型 最 小 
化 ,只 在 一 台 主 机 上 实现 通过 MapReduce 模型 处 理 大 数据 。 


案例 : 实现 MapReduce 模型 


大 数据 处 理 的 内 容 没 有 局 限 ,只 要 你 有 数据 ,就 可 以 拿 来 做 各 种 各 样 的 分 析 。 最 常见 
的 分 析 可 能 就 是 日 志文 件 了 ,日 志文 件 记 录 了 网 站 的 所 有 访问 行为 ,通过 分 析 日 志 能 够 对 
网 站 用 户 有 更 进一步 的 了 解 从 而 改善 网 站 的 服务 。 互 联网 应 用 中 数 亿 条 的 访问 记录 是 非 
常常 见 的 。 

如 果 你 没有 日 志文 件 , 可 以 找 一 些 其 他 比较 大 的 文本 文件 。 曾 有 人 用 大 数据 分 析 过 苏 
轼 ,下 面 我 们 就 用 大 数据 的 方法 分 析 一 下 ( 李 太 白 集 》, 看 看 会 有 什么 结果 。 


16.41 案例 设计 


因为 是 要 模拟 Hadoop 的 MapReduce 模型 ,虽然 没有 分 布 式 环境 ,但 我 们 要 把 “ 戏 ” 做 
足 ,数据 处 理 的 流程 一 个 也 不 能 少 , 按 照 Hadoop 的 风格 ,我 们 分 三 步 来 做 这 件 事 。 

第 一 步 : 将 大 文件 分 割 成 若干 份 ,每 份 大 小 要 根据 实际 情况 决定 (主要 是 看 计算 机 的 配 
置 , 比 如 内 存 的 大 小 ) 。 

第 二 步 : 将 第 一 步 分 割 出 来 的 文件 分 别传 输 到 多 个 主机 上 ,由 各 个 主机 上 的 map 函数 
进行 处 理 , map 函数 主要 就 是 统计 分 给 自己 的 这 部 分 文件 的 词 频 , 每 个 map 函数 都 可 以 同 
时 处 理 几 个 文件 ,处 理 后 再 将 结果 保存 为 一 个 文本 文件 。 

第 三 步 : 将 各 个 主机 的 map 函数 统一 交 给 reduce 处 理 后 ,将 得 到 同 二 8 
的 结果 进行 汇总 。 中 

Er 


16.42 分割 文件 
这 里 我 们 用 到 的 4 李 太 白 集 ?是 事先 保存 好 的 utf-8 编码 的 txt 文件 本 | 
ps 
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libai. txt。 注 意 : 超大 文件 可 能 无 法 直接 打开 ,好 在 Python 可 以 逐 行 读 取 文本 文件 ,我 们 将 
每 100 行 保存 为 一 个 文件 。 如 果 是 其 他 大 数据 文件 ,可 以 视 内 存 大 小 适当 调整 。 另 外 ,因为 
涉及 中 文 ,为 保证 实验 顺利 ,请 确保 所 有 文件 都 是 utf-8 编码 。 


#DataSp1lit.PY 
import os 
import os .path 


def dataSplit (sFile, dFolder): 


line = 100 # 每 个 文件 保存 行 数 

datatemp = [] # 缓 存 列表 

n=1 # 分 割 后 的 文件 序号 

if not os.path.isdir (dFolder): # 判 断 目标 目录 是 否 存在 
os.mkdir (dFolder) # 创 建 目标 目录 


with open (sFile, 'r', encoding = 'utf8') as sf: 
dataline = sf.readline() 
while dataline: # 判 断 是 否 从 云 文件 读 取 到 数据 
for row in range (line): # 读 取 100 行 
datatemp .append(dataline) # 向 缓存 添加 一 行 
dataline = sf.readline() 


if not dataline: # 原 文件 读 取 不 到 数据 时 结束 循环 


break 


dfilename =os.path.join(dFolder， 


os.path.split(sFile) [1] + 
Ser EX 


with open (dfilename, 'w', encoding = 'utf8') as df: 
df.writelines (datatemp)  ”# 将 缓存 写 人 目标 文件 


datatemp = [] # 清 空 缓存 
Print ("%s 创建 成 功 " $dfilename) 
n+=1 

bb 


datasplit ("libai.txt", "libai") 


经 过 分 割 后 ,原本 的 1 个 文本 文件 被 分 割 成 了 4 个 ( 见 图 16-1) 。 
16.4.3 ”编写 map 函数 


文件 分 割 完 毕 ,就 要 交 给 map 处 理 了 ,正常 情况 下 的 map 都 是 分 布 处 理 的 ,所 以 可 以 将 
数据 分 析 的 核心 代码 放 在 这 里 。 我 们 要 做 的 就 是 读 取 文件 ,过 滤 数 据 、 分 析 词 频 ,将 得 到 的 
结果 再 另存 为 一 个 文件 。 因 为 这 个 文件 只 包含 关键 词 和 词 频 ,所 以 要 比 原文 件 小 得 多 ,最 
后 再 将 这 些 新 生成 的 小 文件 合成 一 个 文件 交 给 reduce,reduce 拿 到 各 主机 的 小 文件 再 汇总 


合成 一 个 大 文件 。 


这 里 涉及 一 个 问题 ,就 是 我 们 要 读 取 中 文 ,并 且 统 计 中 文 词语 的 词 频 ,怎么 实现 呢 ? 还 
是 要 感谢 强大 的 Python, Python 中 有 一 个 专门 用 来 统计 中 文 词 频 的 jieba 库 , 可 以 统计 单 
字 也 可 以 统计 词语 ,只 需要 pip install jieba 安装 上 就 可 以 用 了 。 
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图 16-1 文件 分 割 结果 


jieba 有 精确 模式 、 全 模式 、 搜 索引 擎 模式 三 种 ,其 具体 算法 我 们 就 不 研究 了 ,实际 用 起 
来 很 简单 ,只 要 把 字符 串 给 它 , 它 就 会 自动 判断 词语 ,然后 返回 列表 生成 器 。 为 了 方便 看 到 


效果 ,我 们 先 用 一 首 ( 江 城子 ) 看 一 下 jieba 几 种 模式 的 分 析 结 果 。 


#jcz.py 
import jieba 
import jieba.analyse 


text = """ 苏 轼 (江城 子 ) 乙 卯 正月 二 十 日 夜 记 梦 

十 年 生死 两 茫茫 ,不 思量 , 自 难忘 。 千 里 孤 坟 ,无 处 话 证 凉 。 
纵使 相逢 应 不 识 , 尘 满面 , 斤 如 霜 。 

夜来 幽 梦 忽 还 乡 ,小 轩 窗 , 正 梳 妆 。 相 顾 无 言 , 叭 有 泪 千 行 。 
料 得 年 年 肠 断 处 ,明月 夜 , 短 松 岗 。""" 


#seg list =jieba.cut (text, cut all = False) # 精 确 模式 (默认 模式 ) 
seg list =jieba.cut (text) 
print (" [精确 模式 ] : "，"/ ".join(seg list)) 


seg list2 = jieba.cut (text, cut all = True) # 全 模式 
print (" [全 模式 ] : "，"/ ".join(seg list2)) 


seg list3 = jieba.cut for search (text) # 搜 索引 擎 模式 
print (" [搜索 引擎 模式 ] : ","/ ".join(seg list3)) 


tags = jieba.analyse .extract tags (text，topK = 5) 
Print (" [关键 词 ]:"，" / ".join(tags)) 


执行 结果 : 


[精确 模式 ] : 
/ 苏轼 /《/ 江城 子 / ?7 
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/ 乙 卯 / 正月 / 二 十 / 日 夜 / 记 梦 / 

/ 十 年 / 生死 / 两 / 茫茫 / ,/ 不 / 思量 / ,/ 自 / 难忘 / 。/ 千里 / 孤 坟 / ,/ 无 处 / 话 / 琴 凉 / 。/ 纵 
使 /相逢 / 应 不 识 / ,/ 尘 / 满面 / ,/ 焰 / 如 霜 / 。/ 

/ 夜来 / 幽 梦 / 忽 / 还 乡 / ,/ 小 轩 窗 / ,/ 正 梳妆 / 。/ 相 顾 /无 言 /,/ 唯 有 / 泪 千 行 / 。/ 料 得 / 年 / 
年 / 肠 断 / 处 / ,/ 明月 / 夜 / ,/ 短 / 松 岗 / 。 

[全 模式 ] : 

/ 苏轼 / / / 江城 / 江城 子 / 城子 / / 

Wa E/T RA 

/十 年 / 生死 / 两 / 茫茫 / / /不 / 思量 / / / 自 / 难忘 / / /千里 / 孤 坟 / / / 无 处 / 话 / 瑟 凉 / / / 纵 
使 /相逢 / 应 / 不 识 / / / 尘 / 满面 / / / 里 / 如 / 霜 / / 

/ 夜来 / 幽 梦 / 忽 / 还 乡 / / / 小 轩 窗 / / / 正 梳妆 / 梳妆 / / / 相 顾 / 无 言 / / / 唯 有 / 泪 千 行 / 千 行 / 
/ / 料 得 / 年 / 年 / 肠 断 / 处 / / / 明月 / 月 夜 / / / 短 / 松 岗 / / 

[搜索 引擎 模式 ] : 

/ 苏轼 /《/ 江城 / 城子 / 江城 子 / 》/ 

/ 乙 卯 / 正月/ 二 十 / 日 夜 / 记 梦 / 

/ 十 年 / 生死 / 两 / 茫茫 / ,/ 不 / 思量 /,/ 自 / 难忘 / 。/ 千里 / 孤 坟 / ,/ 无 处 / 话 / 凄凉 / 。/ 纵 
使 /相逢 / 不 识 / 应 不 识 / ,/ 尘 / 满面 / ,/ 挨 / 如 霜 / 。/ 

/ 夜来 / 幽 梦 / 忽 / 还 乡 / ,/ 小 轩 窗 / ,/ 梳妆 / 正 梳妆 / 。/ 相 顾 / 无 言 / ,/ 唯 有 / 千 行 / 泪 千 行 / 。 
/ 料 得 / 年 /年 / 肠 断 / 处 / ,/ 明月 / 夜 / ,/ 短 / 松 岗 / 。 

[关键 词 ] : 小 轩 窗 / 正 梳妆 / 泪 千 行 / 松 岗 / 江城 子 


从 结果 来 看 ,精确 模式 最 符合 我 们 的 要 求 ,但 是 需要 用 正则 去 掉 标点 和 空白 。 所 以 下 
面 选择 精确 模式 ,通过 字典 作 计 数 器 。 
下 面 再 回来 处 理 我 们 刚 分 割 的 文件 ( 李 太白 集 》。 


#Map.py 
import jieba 
import os 
import os .Path 
import re 


def Map(sFile, dFolder): 
datatemp = {} 
if not os.path.isdir (dFolder): # 判 断 目标 目录 是 否 存在 
os .mkdir(dFolder) # 创 建 目标 目录 
with open (sFile, 'r', encoding = 'utf8') as sf: 
datatext = sf.read() 
seg list =jieba.cut (datatext)  # 精 确 模 式 (默认 是 精确 模式 ) 
forw in seg list: 
if w in datatemp: 
datatemp [w] += 1 
else: 
datatemp [w] =1 


dList = [] 
for k,v in datatemp .items () : 
if not re.findall('[\n，、()"":!。《》\s]'，k) : 
dList.append(k +''+'"'+str(v) + '\n') 
dfilename = os.path.join(dFolder, 
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os .path.split(sFile) [1] + ".map.txt") 
with open (dfilename, 'w', encoding = 'utf8') as df: 
df .writelines (dList) # 将 缓存 写 入 目标 文件 
print ("%s 处 理 完毕 " $dfilename) 


Map ("libai\libai .txtl1.txt", 'libai') 
Map ("libai\libai .txt2.txt", 'libai') 
Map ("libai\libai .txt3.txt", 'libai') 
Map ("libai\libai .txt4.txt", 'libai') 


这 段 代码 的 工作 就 是 读 取 分 割 完毕 的 小 文件 ,提取 词语 用 字典 作 计数 器 ,再 用 正则 过 
滤 掉 标点 和 空白 等 无 用 信息 ,最 后 将 合格 的 统计 数据 另存 储 到 一 个 文件 中 。 

现在 假设 这 些 文本 文件 经 网 络 聚 到 reduce 所 在 主机 (实际 这 个 实验 我 们 就 是 一 台 主 
机 ), 接 下 来 由 reduece 进行 数据 合并 。 


#Reduce.py 
import os 
import os .path 


def Reduce (sFolder, dFile): 
datatemp = {} 
for root,dirs,files in os.walk(sFolder): 
for f in files: 
if f.endswith(".map.txt"): 
with open (os .path.join(root,f),'r', encoding = 'utf8') as sf: 
for line in sf: 
#print (line) 
k,v = line.split () 
#print (line) 
if k in datatemp: 
datatemp [k] = int (datatemp[k]) + int(v) 
else: 
datatemp [k] = 
dList = [] 
for k,v in datatemp .items () : 
dList.append(K +'"'+''+str(v) + '\n') 


with open (dFile, 'w', encoding= 'utf8') as df: 
df .writelines (dList) # 将 缓存 写 人 目标 文件 
print ("%s 合并 成 功 " sdFile) 


i |, 
Reduce ("libai", 'rlibai .txt') 


这 里 仅仅 将 每 个 小 文件 中 的 数据 读 取 出 来 合并 数据 ,最 终 存 储 为 一 个 文件 rshijiu. txt， 
这 里 面 就 是 我 们 关心 的 数据 了 ,你 可 以 打开 看 看 ,但 是 作为 程序 员 ,我 们 应 该 有 更 好 的 办 
法 ,再 写 个 显示 的 工具 吧 。 
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这 用 的 是 之 前 介绍 过 的 方法 ,显示 结果 如 下 : 
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由 于 jieba 算法 的 原因 ,这 里 我 们 看 到 的 都 是 一 个 字 , 不 过 , 古 汉语 微 言 大 义 、 字 字 千 钧 。 
可 以 看 到 ,在 李白 的 诗 中 除了 “我 “去 ”这 样 的 字 , 出 现 最 多 的 就 是 月 ”了 ,想起 “ 床 前 明月 
光 ” 了 吗 ? 不 难看 出 诗人 将 明月 作为 寄托 。 不 过 这 个 分 析 还 存在 很 多 问题 ,要 想 真正 了 解 
李白 , 仅 靠 这 个 肯定 是 不 够 的 。 


>A 彩蛋 : 词 云 
可 能 你 觉得 上 面 的 效果 不 那么 酷 , 那 我 们 就 来 一 个 看 起 来 酷 炫 的 显示 效果 一 一 词 去 


( 见 图 16-2)。 看 到 图 16-2 的 效果 ,心动 了 吧 。 其 实 最 简单 的 词 云 实现 只 需要 十 行 代码 ( 别 
急 着 看 后 面 的 代码 ,通常 代码 少 就 意味 着 准备 工作 要 做 足 ) ,一 起 来 看 一 下 吧 。 





图 16-2 词 云 示意 图 


要 想 做 词 云 需 要 装 三 个 包 : matplotlib ,jieba 和 wordcloud 。 

如 果 你 做 了 16. 4 节 的 案例 ,前 两 个 包 就 不 用 安装 了 ,看 起 来 只 要 再 安装 一 个 
wordcloud 就 行 了 ,不 过 ,错误 经 常会 出 现在 这 里 ,现在 就 来 看 一 下 需要 注意 和 可 能 碰 到 的 
问题 。 

首先 ,你 可 以 尝试 pip install wordcloud 直接 安装 ,但 直接 安装 多 数 情况 会 报错 ,可 以 先 
在 github 下 载 wordcloud 的 包 , 解 压缩 后 ,在 对 应 目录 下 用 python setup. py install 安装 。 
如 果 成 功 , 第 一 个 坑 就 过 去 了 , 没 成 功 就 要 看 报错 信息 了 ,有 可 能 是 依赖 包 的 问题 , 那 就 安 
装 依赖 包 , 主 要 是 有 可 能 会 碰 到 图 16-3 所 示 的 错误 。 


error: Microsoft Uisual C++ 14.0 is required. Get it with “Microsoft Visual C 


++ Build Tools”: http://landinghub.visualstudio.com/visual-cpp-build-tools 





16-3 ”错误 示意 图 


这 个 原因 写 得 很 清楚 ,是 需要 Visual C++ 14.0, 你 可 以 去 微软 的 官网 下 载 安 装 。 

还 有 一 个 简单 的 办 法 ,就 是 到 https://www. lfd. uci. edu/~ gohlke/pythonlibs/# 
wordcloud 安装 whl 版 本 的 包 ,一 定 要 选择 跟 自己 系统 对 应 的 版 本 ( 见 图 16-4) 。 

找到 文件 路 径 执 行 下 面 这 个 命令 就 可 以 了 ,但 是 版 本 不 对 就 会 出 现 红字 报错 ( 见 图 16-5)。 

安装 成 功 后 ,只 需要 十 行 代码 就 可 以 画 出 词 云 了 ,不 过 ,这 个 跟 MapReduce 是 没有 关系 
的 ,不 要 和 弄 混 了 。 
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C 





Worddoud, a little word cloud generator. 


Wordcloud 14.1 -cp27 -cp27m win32 whl 
wordcloud -14.1-cp27-cp27m win amd64whl 
wordcloud-1.4.1-cp34 -cp34m win32 whl 

Wordcloud-1.4.1-cp34-cp34m-win amd64whl 
Wordcloud-1.4.1-cp35-cp35m-win32.whl 
wordcloud-1.4.1-cp35-cp35m-win amd64whl 
wordcloud-1.4.1-cp36-cp36m-win amd64whl 
Wordcloud -1.4.1 -cp37 -cp37m win32 wh 


wordcloud 141 cp37 cp37m win amd64 whl 





















https/ vwwfd uci.edu/~gohlke/pythonlibs/#wordcloud 








图 16-4 wordcloud.whl 包 


C:\Users\milo>pip install wordcloud-1.4.1-cp36-cp36m-win_amd64.whl 





#wordcloud19.py 


16-5 报错 


import matplotlib.pyplot as plt| 
from wordcloud import WordCloud 


import jieba 


filetext = open('libai.txt', encoding = 'utf8') .read() 
wordlist = jieba.cut (filetext, cut all = True) 


Wl_space split ="" 


join(wordlist) 





# 设置 词 云 属性 ,并 生成 词 云 


my_wordcloud = WordCloud (font path = "C:\WindowsFonts\simhei.ttf").generate (wl_ 


space split) 


# 以 下 三 行 绘图 


plt.imshow (my_wordcloud) 


P1t.axis("off") 
plt.show!() 


这 个 代码 出 来 的 效果 如 图 16-6 所 示 。 
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图 16-6 《 李 太 白 集 ) 高 频 词 词 云 
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这 里 就 能 很 直观 地 看 到 一 些 内 容 了 ,可 以 看 到 ,李白 的 诗 里 出 现 最 多 的 是 “明月 ”“ 春 
风 ”“ 相 思 ” 等 。 对 不 熟悉 李白 的 人 ,这 样 似乎 更 能 直观 地 感受 到 诗人 浪漫 主义 的 情怀 ,还 能 
知道 他 曾 去 过 的 一 些 地 方 等 。 

需要 注意 的 是 ,font_path 后 面 是 你 计算 机 字体 库 中 的 字体 ,系统 不 同 ,路 径 和 名 字 都 会 
有 区 别 ,本 例 选择 的 是 黑体 。 

如 果 你 想 画 出 图 16-2 所 示 的 形状 ,就 需要 加 背景 图 片 遮蔽 ,简单 来 说 就 是 图 片 什么 样 ， 
图 云 就 是 什么 形状 。 你 可 以 自己 试 试 。 


噶 重点 提示 


在 这 一 章 中 ,你 要 掌握 的 内 容 : 
(1) 理解 MapReduce 模型 。 
(2) 理解 案例 模型 实现 的 思路 。 


3 动 动手 
参考 本 章 案例 进行 实践 。 





语音 识别 技术 也 被 称 为 自动 语音 识别 (Automatic Speech Recognition ,ASR) 。 这 里 提 
及 的 语音 识别 技术 ,其 目的 是 将 人 类 语音 中 的 词汇 内 容 转 换 为 计算 机 可 读 的 输入 ,例如 按 
键 、 二 进 制 编码 或 者 字符 序列 ,而 不 是 根据 声音 判断 说 话 人 是 谁 。 

语音 识别 技术 的 应 用 非常 广泛 ,包括 语音 拨号 、 语 音 导航 、 室 内 设备 控制 .语音 文档 检 
索 \ 简 单 的 听写 数据 录入 等 。 语 音 识别 技术 与 其 他 自然 语言 处 理 技术 如 机 器 翻译 及 语音 合 
成 技术 相 结 合 , 可 以 构建 出 更 加 复杂 的 应 用 ,例如 语音 到 语音 的 同 声 传译 。 另 外 ,在 你 身边 
现在 也 有 各 种 各 样 的 语音 识别 ,比如 语音 控制 手机 、 语 音 控制 输入 法 、 语 音 控制 操作 系统 ， 
市 面 上 的 智能 音响 也 都 是 语音 识别 技术 的 应 用 。 

因为 Python ,语音 识别 可 以 以 一 种 非常 简单 的 形式 开始 ,但 这 只 是 一 个 体验 的 方式 , 因 
为 简单 的 语音 识别 可 能 会 受到 噪声 干扰 而 影响 实验 结果 。 这 一 章 用 到 的 模块 是 基于 
Python 2 的 ,我们 也 仅仅 是 作为 一 个 体验 拓展 性 的 介绍 ,实际 的 语音 识别 开发 方式 很 多 ,也 
不 局 限于 Python 2。 


> 了 YA 选择 语音 识别 包 


国内 的 百度 、 阿 里 云 和 讯 飞 等 都 提供 了 语音 识别 平台 的 API(Application Programming 
Interface, 应 用 程序 编程 接口 )。PyPi 上 还 有 很 多 用 于 语音 识别 的 软件 包 , 例 如 : 





apiai 

google-cloud- speech 
pocketsphinx 

speech 
SpeechRecognition 
watson-developer-cloud 
PyAudio 


这 些 软 件 包 功 能 各 异 ,其 中 有 一 些 软 件 包 ( 如 apiai) 提供 了 内 置 功能 ,例如 识别 说 话 者 
意图 的 自然 语言 处 理 , 这 些 内 置 功能 超出 了 基本 的 语音 识别 功能 。 其 他 的 软件 包 , 比如 
google-cloud-speech, 只 关注 语音 到 文本 的 转换 ;speech 仅 用 于 Windows 系统 。 

在 易 用 性 方面 ,这 里 有 两 个 最 佳 选 择 : speech 和 SpeechRecognition 。 

语音 识别 需要 音频 输入 ,获取 音频 的 方式 有 两 种 : 一 种 是 通过 音频 文件 获取 ;一 种 是 通 
过 麦克 风 直 接 获取 。 
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如 果 你 在 Windows 系统 做 语音 识别 开发 ,用 speech 就 非常 方便 , 它 可 以 直接 利用 
Windows 系统 的 麦克 风 和 语音 识别 功能 。 我 们 在 17. 2 节 中 会 介绍 speech 的 用 法 。 

而 SpeechRecognition 则 更 灵活 ,SpeechRecognition 可 以 很 便捷 地 使 用 麦克 风 和 音频 
文件 ,可 以 在 几 分 钟 内 启动 并 和 运行。 如果 你 想 要 使 用 SpeechRecognizer 访问 麦克 风 , 就 必 
须 安 装 PyAudio 包 。 

SpeechRecognition 库 还 封装 了 几 个 非常 流行 的 语音 识别 API, 比如 Google Web 
Speech API, 甚 至 其 中 还 包含 了 Google Web Speech API 的 默认 密 钥 ,这 意味 着 你 可 以 不 必 
注册 登录 Google 就 能 够 运行 起 来 。 

SpeechRecognition 包 的 灵活 性 和 易 用 性 使 其 成 为 绝 佳 选择 。 如 果 你 想 深 入 研究 语音 
识别 技术 ,我 强烈 推荐 (但 是 不 保证 支持 它 包 装 的 每 个 API 的 每 个 功能 ) 。 你 需要 花 一 些 时 
间 深 入 研究 ,以 确定 SpeechRecognition 是 否 适 用 于 你 的 特定 情况 。 

为 了 让 你 的 第 一 次 语音 识别 体验 更 顺畅 ,下 面 直接 利用 speech 做 一 些 尝试 。 


speech 模块 


Windows 已 经 有 很 成 熟 的 语音 识别 技术 ,Python 中 有 个 speech 模块 ,提供 了 一 个 简单 
的 接口 对 应 Windows 语音 识别 技术 。 我 们 可 以 利用 Windows 的 语音 识别 技术 ,实现 将 语 
音 转 换 为 文本 或 者 将 文本 转换 为 语音 。 

speech 模块 有 自己 的 官方 站 点 : http://python-speech-features. readthedocs. io, 有 兴 
趣 的 可 以 多 了 解 一 下 。 主 要 功能 包括 识别 语音 并 转换 成 文本 ;文本 合成 语音 ,特定 词 的 识 
别 , 比 如 对 获取 的 声音 进行 特定 词 的 捕 提 ;特定 发 声 人 特定 词 的 捕捉 。 下 面 将 实现 语音 和 
文字 之 间 的 转换 。 


人 1724 语音 识别 开发 环境 搭建 


要 在 Windows 中 进行 语音 识别 开发 ,主要 需要 三 个 工具 Python、 speech 模块 以 及 
Microsoft Speech SDK 。 

相关 软件 安装 方法 如 下 。 

(1) Python 2 或 Python 3: speech 支持 Python 2, 所 以 如 果 你 要 用 speech 开发 ,现在 
最 好 使 用 Python 2.7。 如 果 你 是 Python 3, 想 体验 一 下 ,在 后 面 也 会 介绍 怎么 用 Python 3 
体验 语音 识别 技术 。 

(2) Microsoft Speech: 如 果 你 的 系统 版 本 高 于 Windows 8 ,那么 恭喜 你 ,系统 是 自 带 语 
音 识别 技术 的 。 如 果 系 统 版 本 低 , 可 以 到 微软 的 官网 下 载 (https://www. microsoft. com/ 
en-us/download/details. aspx? id 一 10121) ,默认 安装 就 可 以 了 。 

(3) pywin32: pywin32 即 Python for Windows Extensions, 提 供 了 Pyhton 访问 和 调 
用 Windows 底层 功能 函数 的 接口 ,直接 pip install pywin32 安装 就 可 以 了 。 

(4) speech: 直接 pip install speech 就 可 以 ,如 果 失 败 , 可 以 自行 下 载 speech. py, 并 放 
到 Python 安装 路 径 下 的 site-packages 目录 就 可 以 了 ,比如 我 的 就 是 在 这 里 C:\\Python\ 
Python36-32\lib\site-packages\speech. py。 
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1722 环境 配置 和 调试 
现在 你 可 以 导入 speech 模块 来 看 一 下 模块 是 否 安装 成 功 ( 见 图 17-1)。 


>>> import speech 
Traceback (most recent call last) 
File “<stdin>”, line 1, in <module> 
File “C:\Users\milo\AppData\Local\Programs\Python\Python36-32\1ib\site 


-packages\speech.py”, line 157 
print prompt 


SyntaxError: Missing parentheses in call to ‘print* 





图 17-1 导入 speech 模块 


如 果 是 Python 2.7, 这 里 不 会 有 问题 ;如 果 是 Python 3, 就 可 能 会 看 到 这 个 报错 ,原因 
是 安装 的 speech. py 是 按照 Python 2 来 写 的 ,Python 3 中 已 经 不 用 print 命令 了 。 若 为 
Python 3 ,解决 办 法 就 是 按 报错 提示 的 路 径 ,找到 speech. py 文件 : 





line157(157 行 )， 修 改 print prompt, 改 成 print (prompt) 


另外 ,在 Python 3 环境 下 ,还 会 碰 到 一 个 问题 ,需要 进行 一 点 修改 (Python 2. 7 不 需 
要 ) ,修改 如 下 


line59(159 行 ) ,将 import thread, 改 成 import threading 
class T(threading.Thread): 
""" 增 加 这 个 自 定义 类 "ww 
ef dnit self)s 
threading.Thread. init _(self) 
def run(self): 
pass 


def ensure event thread(): 
mm 
Make sure the eventthread is running, which checks the handlerqueue 
for new eventhandlers to create and runs the message pump. 
mm 
global _eventthread 
if not eventthread: 
def loop(): 
while eventthread: 
pythoncom.PumpWaitingMessages () 
if handlerqueue: 
(context,listener,callback) = _ handlerqueue .pop() 
#Just creatinga ListenerCallback object makes events 
#fire till listener loses reference to its grammar object 
_ListenerCallback (context, listener, callback) 
time.sleep(.5) 
_eventthread =T() # 此 处 修改 
_eventthread. start () # 此 处 修改 


修改 后 ,不 报错 就 可 以 成 功 导 入 speech 了 ,如 果 之 前 没有 开启 语音 支持 ,如 Windows 
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10 会 自动 弹出 启动 语音 识别 设置 ,如 果 没 弹出 ,也 要 手动 设置 一 下 并 且 启 动 ,方法 如 下 。 
打开 控制 面板 找到 语音 识别 ( 见 图 17-2) ,启动 语音 识别 就 可 以 了 ,基本 上 按 默认 设置 
就 可 以 了 。 


| 帅 语音 in8J 
个 有 、 控 制 面板 ， 径 松 使 用 》 语 音 iR8 


拉面 主页 配置 你 的 语音 识别 体验 


高 级 语音 选项 筷 启动 语音 识别 (S) 
文本 到 语音 转换 开始 使 用 你 的 语音 控制 计算 机 。 


D5 设置 麦克 风 (M) 


设置 你 的 计算 机 以 便 能 六 正常 使 用 语音 识别 功能 。 


学 习 语音 教程 (P) 
学 习 通 过 语音 使 用 你 的 计算 机 。 学 习 基 本 命令 和 听 
写 。 


训练 你 的 计算 机 以 使 其 更 了 解 你 (R) 

向 计算 机 岗 读 文本 以 提高 计算 机 理解 你 的 语音 的 能 
力 。 这 样 做 并 不 是 必须 的 ， 但 可 以 提高 听写 准确 
性 。 


打开 语音 参考 卡片 (C) 
查看 并 打印 常用 命令 列表 ， 把 它们 放 在 身边 ， 这 样 
你 就 始终 知道 要 说 什么 。 





图 17-2 ”启动 语音 识别 


除了 启动 语音 识别 ,还 有 设置 麦克 风 , 甚 至 学 习 语 音 教 程 ,另外 ,在 左 侧 的 高 级 语音 设 
置 里 面 还 有 启动 试 运行 语音 识别 .启用 语音 激活 等 设置 。 

启动 了 系统 的 语音 识别 , 接 下 来 就 是 见证 奇迹 的 时 刻 , 确 认 打 开 音 箱 和 麦克 风 可 用 ,你 
只 需要 做 下 面 的 事情 : 


>>> import speech 
>>> speech.say ("hello! 分 琪 鲜 !") 
>>> speech.say ("欢迎 使 用 speech!") 


听 到 计算 机 里 面 的 女孩 跟 你 打招呼 了 吗 ? 


17.2.3 文字 和 声音 相互 转化 


现在 只 需要 调用 一 个 say 方法 就 能 说 话 了 ,这 就 是 speech 将 文字 转 为 语音 的 方法 ,你 
完全 可 以 写 一 个 会 讲 故事 的 程序 啊 。 

如 果 想 要 识别 语音 并 转化 为 文字 ， eg 只 需要 一 个 speech. input() 方 法 。 
speech. input() 的 用 法 和 input() 类 似 , 只 不 过 一 个 是 等 待 用 户 输入 声音 ,一 个 是 等 竺 用户 
输入 字符 。 


import speech 
saysomething = speech.input ("hello! Say something!") 
speech.say (saysomething) 
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Print(saysomthing) 


这 段 代 码 运行 后 ,首先 屏幕 上 显示 hello! Say something! ,然后 我 们 对 麦克 风 说 一 句 
“你 好 ”, 这 时 语音 就 会 转 为 文字 赋值 给 saysomething ,你 可 以 让 计算 机 说 出 来 ,也 可 以 显示 
到 屏幕 上 。 不 过 这 个 实验 最 好 在 Python 2.7 上 做 ,在 Python 3 可 能 会 有 些 问 题 。 

现在 我 们 已 经 可 以 让 计算 机 说 话 ,也 可 以 让 计算 机 听 懂 我 们 的 话 了 。 你 会 发 现 , 这 就 
是 将 输入 /输出 从 字符 串 变 成 了 语音 而 已 , 剩 下 其 他 的 关于 逻辑 开发 , 跟 之 前 没什么 两 样 。 

需要 说 明 一 点 ,因为 噪声 等 原因 ,这 个 实验 的 成 功率 比较 低 。 不 过 ,不 必 担 心 没 有 掌握 
这 项 技术 ,前 面 我 们 说 过 ,这 是 一 个 体验 性 的 实验 ,真正 要 做 语音 开发 还 有 很 多 方式 可 以 选 
择 , 比 如 SpeechRecognition。 


17.2.4 speech 模块 的 其 他 方法 


在 这 里 仅仅 是 通过 一 个 小 工具 看 到 了 Python 的 便捷 之 处 , 且 不 说 其 他 开发 接口 , 单 
speech 就 还 有 很 多 实用 的 方法 ,比如 下 面 这 些 。 

speech. listenforanything(callback) : 听 到 任何 信息 就 启动 一 个 独立 线程 callback 。 

speech. listenfor(phraselist, callback) : 将 指定 语音 转化 为 文字 。 

speech. listener. islistening(): 指定 特定 听 者 处 于 监听 状态 。 

speech. listener. stoplistening() : 指定 特定 听 者 处 于 关闭 状态 。 

speech. islistening(): 开启 所 有 听 者 。 

speech. stoplistening(): 关闭 所 有 听 者 。 

通过 speech 除了 让 计算 机 讲 故 事 , 还 可 以 利用 speech 语音 控制 计算 机 。 如 果 你 对 语 
音 技术 感 兴趣 , 那 就 大 胆 探索 吧 。 


硬 重点 提示 


在 这 一 章 中 ,你 要 掌握 的 内 容 : 

在 这 一 章 我 们 通过 一 个 容易 上 手 的 模块 来 了 解 语音 识别 技术 的 应 用 ,可 以 参考 本 章 案 
例 进行 练习 。 若 想 要 深入 了 解 ,可 以 在 线 了 解 语音 识别 API, 比 如 百度 就 提供 了 Python 接 
口 以 及 详细 的 使 用 说 明 。 


3 动 动手 
尝试 一 下 看 起 来 很 神奇 的 语音 识别 吧 ! 





六 行 代码 入 门 机 器 学 习 


人 工 智能 (AI) 越 来 越 被 大 家 关注 ,即便 不 是 专业 的 从 业 人 员 , 也 都 会 从 各 种 新 闻 中 看 
到 人 工 智能 的 影子 ,比如 无 人 驾驶 、 人 工 智 能 跟 人 类 棋 手 下 棋 等 。 

机 器 学 习 (Machine Learning) 作 为 人 工 智 能 的 一 个 分 支 ,名 字 可 能 没有 人 工 智 能 响亮 ， 
但 其 相关 技术 已 经 在 我 们 生活 中 的 很 多 地 方 得 以 应 用 ,比如 : 

(1) 网 站 或 淘宝 根据 浏览 过 的 记录 推送 相似 内 容 、 广 告 。 

(2) 医院 的 CT 通过 人 工 智 能 检测 阴影 。 

(3) 手机 、 智 能 电视 的 语音 控制 .语音 转化 为 文字 、 人 脸 识 别 。 

(4) 一 封 电子 邮件 是 否 是 垃圾 邮件 。 

(5) 一 篇 文章 应 该 分 到 科技 政治, 还 是 体育 类 ,一 段 文字 表达 的 是 积极 的 情绪 还 是 消 
极 的 情绪 。 

(6) 测量 市 场 营销 的 成 功 度 。 

(7) 预测 某 个 产品 的 收益 ,股票 。 

(8) Google 预测 到 H1N1 爆发 ,百度 预测 2014 世界 杯 。 

(9) 人 类 基因 剪接 位 点 识别 、 基 于 图 片 的 性 别 检测 、 大 规模 图 片 分 类 。 

这 一 章 内 容 会 从 人 工 智 能 的 一 个 简单 案例 作为 突破 口 ,希望 能 够 为 你 学 习 人 工 智 能 打 
开 一 扇 门 ,有 一 个 轻松 的 开始 。 


人 工 智 能 发 展 简 史 


在 谈论 机 器 学 习 之 前 ,需要 先 搞 清楚 几 个 概念 ,因为 一 说 到 机 器 学 习 , 就 会 有 人 摆 出 来 
一 堆 概 念 , 搞 得 新 手 无 从 下 手 , 什 么 人 工 智能 、 机 器 学 习 、 数 据 挖掘 、 深 度 学 习 等 。 那 它们 到 
底 是 什么 关系 呢 ? 

人 工 智 能 是 最 早出 现 的 ,也 是 最 大 的 集合 (包含 其 他 概念 )。1956 年 , 几 位 计算 机 科学 
家 相聚 在 达 特 茅 斯 会 议 (Dartmouth Conferences) ,提出 了 “人 工 智能 ”的 概念 。 人 工 智 能 曾 
一 度 被 极为 看 好 。 之 后 的 几 十 年 ,人 工 智能 一 直 在 两 极 反 转 , 或 被 称 作 人 类 文明 耀眼 的 未 
来 ;或 被 当成 技术 疯子 的 狂想 扔 到 垃圾 堆 里 。 过 去 几 年 ,尤其 是 2015 年 以 来 ,人 工 智能 开始 
大 爆发 。 很 大 一 部 分 是 由 于 GPU 的 广泛 应 用 ,使 并 行 计算 变 得 更 快 . 更 便宜 .更 有 效 。 当 
然 ,无 限 拓展 的 存储 能 力 和 骤然 爆发 的 数据 洪流 (大 数据 ) 的 组 合 拳 也 使 图 像 数据 文本 数 
据 、 交 易 数据 ,映射 数据 全 面 海量 爆发 。 
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人 工 智 能 最 开始 要 实现 的 是 “强人 工 智能 ”(General AD ,也 就 是 通过 计算 机 构造 复杂 
的 .拥有 与 人 类 智慧 同样 本 质 特 性 的 机 器 。 通 常 科幻 电影 里 有 了 自我 意识 要 消灭 人 类 的 就 
是 这 种 ,但 实际 上 , 现 阶 段 来 看 这 是 不 可 能 的 。 我 们 目前 能 实现 的 ,一 般 被 称 为 “ 弱 人 工 智 
能 ”(Narrow AID) 。 弱 人 工 智能 是 能 够 与 人 一 样 , 甚 至 比 人 更 好 地 执行 特定 任务 的 技术 。 例 
如 ,Pinterest 上 的 图 像 分 类 或 者 Facebook 的 人 脸 识别 。 这 些 技 术 实现 的 是 人 类 智能 的 一 
些 具体 的 局 部 。 但 它们 是 如 何 实现 的 ? 这 种 智能 是 从 何 而 来 ? 这 就 是 机 器 学 习 。 

机 器 学 习 是 一 种 实现 人 工 智能 的 方法 ,其 最 基本 的 做 法 是 使 用 算法 解析 数据 .从 中 
学 习 , 然 后 对 真实 世界 中 的 事件 做 出 决策 和 预测 。 与 传统 的 为 解决 特定 任务 、 硬 编码 的 
软件 程序 不 同 , 机 器 学 习 是 用 大 量 的 数据 来 “训练 ”, 通 过 各 种 算法 从 数据 中 学 习 如 何 完 
成 任务 。 

机 器 学 习 直 接 来 源 于 早期 的 人 工 智 能 领域 。 传 统 算法 包括 决策 树 学 习 、 推 导 逻 辑 规 
划 、 聚 类 、 强 化 学 习 和 贝 叶 斯 网 络 等 。 众 所 周知 ,我 们 还 没有 实现 强人 工 智 能 。 早 期 机 器 学 
习 方 法 甚至 都 无 法 实现 弱 人 工 智 能 。 

机 器 学 习 目 前 最 成 功 的 应 用 领域 应 该 就 是 计算 机 视觉 了 ,比如 识别 车 牌号 。 

深度 学 习 (Deep Learning) 是 一 种 实现 机 器 学 习 的 技术 ,是 由 早期 机 器 学 习 中 的 一 个 重 
要 算法 一 一 人 工 神经 网 络 (Artificial Neural Networks) 发 展 出 来 的 。 神 经 网 络 的 原理 是 受 
我 们 大 脑 的 生理 结构 (互相 交叉 相连 的 神经 元 ) 启 发 。 但 与 大 脑 中 一 个 神经 元 可 以 连接 一 
定 距离 内 的 任意 神经 元 不 同 , 人 工 神经 网 络 具 有 离散 的 层 、 连 接 和 数据 传播 的 方向 。 

其 实在 人 工 智能 出 现 的 早期 ,神经 网 络 就 已 经 存在 了 ,但 神经 网 络 对 于 “智能 ”的 贡献 
微乎其微 。 主 要 问题 是 ,即使 是 最 基本 的 神经 网 络 , 也 需要 大 量 的 运算 ,神经 网 络 算法 的 运 
算 需 求 难以 得 到 满足 。 直 到 GPU 得 到 广泛 应 用 ,深度 学 习 才 得 以 快速 发 展 。 比 如 2012 年 
吴 恩 达 (Andrew Ng) 教 授 在 Google 实现 了 神经 网 络 学 习 到 猫 的 样子 。 吴 教授 的 突破 在 于 ， 
把 这 些 神经 网 络 从 基础 上 显著 地 增 大 了 。 层 数 非常 多 ,神经 元 也 非常 多 ,然后 给 系统 输入 
海量 的 数据 来 训练 网 络 。 在 吴 教 授 这 里 ,数据 是 一 千 万 YouTube 视频 中 的 图 像 。 吴 教授 
为 深度 学 习 加 入 了 “深度 ”(deep)。 这 里 的 “深度 ”就 是 说 神经 网 络 中 众多 的 层 。 

现在 ,经 过 深度 学 习 训练 的 图 像 识 别 , 在 一 些 场景 中 甚至 可 以 比 人 做 得 更 好 : 从 识别 
猫 ,到 辨别 血液 中 癌症 的 早期 成 分 ,到 识别 核磁 共振 成 像 中 的 肿瘤 。Google 的 AlphaGo 先 
是 学 会 了 如 何 下 围棋 ,然后 与 自己 下 棋 训 练 。 它 训练 自己 神经 网 络 的 方法 就 是 不 断 地 与 自 
己 下 棋 , 反 复 地 下 , 永 不 停歇 。 

随 着 计算 机 计算 力 的 增加 ,人 工 智 能 领域 得 到 更 加 飞速 的 发 展 ,或 许 很 快 就 会 有 “终结 
者 ”出 现 了 。 


机 器 学 习 初 体验 : 搭建 机 器 学 习 环境 


用 一 句 话 概 括 机 器 学 习 就 是 机 器 (计算 机 ) 通 过 获取 新 知识 和 新 技能 ,识别 现 有 知识 。 

通过 对 人 工 智能 发 展 的 了 解 , 相 信 你 已 经 发 现 ,机 器 学 习 是 目前 最 能 产生 实际 作用 的 
一 个 分 支 , 而 且 可 以 通过 机 器 学 习 再 向 深度 学 习 递 进 。 而 学 习 最 快 的 途径 就 是 直接 动手 ， 
所 以 我 们 现在 就 开始 吧 。 

机 器 学 习 比 较 流行 的 框架 有 两 个 : scikits-learn 和 TensorFlow。 scikits-learn 主要 适 
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合 中 小 型 .实用 机 器 学 习 项 目 , 尤 其 是 数据 量 不 大 且 需 要 使 用 者 手动 对 数据 处 理 ,并 选择 合 
适 模 型 的 项 目 ,这 类 项 目 使 用 CPU 即 可 。TensorFlow 适合 已 经 明确 需要 用 深度 学 习 , 且 
数据 处 理 需 求 高 的 项 目 , 这 类 项 目 往往 数据 量 较 大 , 且 最 终 需 要 的 精度 高 , 需 GPU 加 速 
运算 。 

下 面 通过 scikits-learn 了 解 机 器 学 习 。 

scikits-learn 有 自己 的 官方 网 站 ( 见 图 18-1), 可 以 在 上 面 找 到 环境 搭建 的 方法 。 


e 治 口 x 
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正在 连接 … 
图 18-1 scikits-learn 官方 网 站 
你 会 找到 下 面 的 安装 说 明 


Installing the Scikit- learn 
Scikit- learn requires: 
Python (>=2.7 or >= 3.3), 
NumPy (>= 1.8.2), 
SciPy (>= 0.13.3). 
If you already have a working installation of numpy and scipy, the easiest way to 
install scikit-learn is using pip 
Pip install - U scikit-learn 


怎么 样 ? 没 那 么 复杂 吧 , 而 且 , 官 方 说 明 还 提 到 了 一 个 办 法 ,就 是 安装 Anconda 集成 环 
境 。Anaconda 指 一 个 开源 的 Python 发 行 版 本 ,包含 了 conda、Python 等 180 多 个 科学 包 及 
其 依赖 项 。 因 为 包含 了 大 量 的 科学 包 ,Anaconda 的 下 载 文 件 比 较 大 ( 约 515MB) ,如 果 只 需 
要 某 些 包 ,或 者 需要 节省 带宽 或 存储 空间 ,也 可 以 使 用 Miniconda 这 个 较 小 的 发 行 版 ( 仅 包 
含 conda 和 Python) 。 可 以 到 Anaconda 官方 网 站 下 载 ,注意 Python 版 本 。 

安装 好 之 后 就 可 以 使 用 了 ,其 实 就 是 一 个 模块 ,import 不 报错 就 可 以 开始 下 一 步 了 ,这 
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也 是 我 们 的 第 一 行 机 器 学 习 代 码 。 


>>> import sklearn 


> 基 [: 下 】 机 器 学 习 的 过 程 


先 考 虑 一 个 问题 ,你 怎样 判断 你 面前 的 物体 是 苹果 还 是 橘子 ( 见 图 18-2)? 机 器 又 是 怎 


么 怎么 判断 的 呢 ? 





图 18-2 ”苹果 和 橘子 


前 面 我 们 说 了 ,机 器 学 习 就 是 使 用 算法 来 解析 数据 ,从 中 学 习 , 然 后 对 真实 世界 中 的 事 
件 做 出 决策 和 预测 。 所 以 ,机 器 学 习 可 以 分 成 三 步 实现 。 

(1) 收集 训练 数据 (Collect Training Data) 。 

(2) 训练 分 类 器 (Train Classifier) 。 

(3) 做 出 预测 (Make Predictions) 。 

让 机 器 判断 物体 是 苹果 还 是 橘子 就 是 我 们 面临 的 问题 ,为 了 解决 这 个 问题 ,需要 写 一 
个 功能 来 区 分 水 果 。 

(1) 将 描述 水 果 的 属性 作为 输入 数据 。 

(2) 根据 重量 、 质 感 等 特性 对 收集 的 数据 进行 预测 这 个 水 果 是 苹果 还 是 橘子 。 


18.31 收集 训练 数据 


为 了 收集 数据 ,我们 想象 超市 的 水 果 货 架 ,看 苹果 和 橘子 的 不 同 之 处 , 想 想 你 是 怎么 分 
辨 苹果 和 橘子 的 ,然后 把 收集 好 的 数据 记录 到 一 张 表 中 。 机 器 学 习 中 这 种 测量 得 到 的 值 叫 
作 特 征 (Features) ,为 简单 起 见 , 我 们 采取 两 个 数据 : 重量 和 质感 ,选择 合适 的 特征 才能 更 
好 地 区 分 水 果 种 类 ,如 表 18-1 所 示 。 


表 18-1 采集 数据 表 














重量 质感 标签 

150g Bumpy Orange 
170g Bumpy Orange 
130g Smooth Apple 
140g Smooth Apple 
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表格 的 每 一 行 都 是 我 们 训练 数据 的 一 个 样本 ,最 后 一 列 称 为 标签 ,用 来 表明 这 个 样本 
是 什么 水 果 , 整 张 表格 就 是 我 们 的 训练 数据 。 

训练 数据 越 多 ,分 类 器 就 越 能 更 好 地 工作 ,我 们 拥有 越 多 的 训练 数据 ,预测 的 结果 也 就 
越 准 确 。 现 在 先 把 训练 数据 转化 为 代码 。 

定义 两 个 变量 : 特征 和 标签 。 

features = [[150, 'bumpy'], [170, 'bumpy'], 


[130, 'smooth'], [140, 'smooth']] 
labels = ['orange', 'orange', 'apple', 'apple'] 


为 了 让 数据 简洁 ,我 们 自 定义 规则 转化 一 下 数据 ,smooth 和 orange 用 1 表示 ,bunpy 
和 smooth 用 0 表示 。 这 样 就 有 了 前 三 行 代码 。 


#sk AppleOrange.py 

import sklearn 

features = [[150, 0], [170, 0], [130, 1], [140, 1]] 
labels = [1, 1, 0, 0] 


18.32 ”训练 分 类 器 并 做 出 预测 


收集 到 数据 后 , 接 下 来 要 做 的 就 是 使 用 这 些 数据 训练 分 类 器 。 分 类 器 有 很 多 类 型 ,或 
者 说 有 很 多 种 算法 ,传统 算法 包括 决策 树 学 习 、 推 导 逻 辑 规 划 、 聚 类 、 强 化 学 习 和 贝 叶 斯 网 
络 等 。 学 习 机 器 学 习 , 本 质 上 是 学 习 算法 。 

按照 训练 的 数据 有 无 标签 ,可 以 将 上 面 提 到 的 算法 分 为 监督 学 习 算法 和 无 监督 学 习 
算法 。 

(1) 监督 学 习 算法 : 决策 树 、 线 性 回归 、 人 逻辑 回归 、 神 经 网 络 .SVM。 

(2) 无 监督 学 习 算法 : 聚 类 算法 、 降 维 算法 。 

还 有 一 个 推荐 算法 较为 特殊 , 既 不 属于 监督 学 习 , 也 不 属于 非 监 督学 习 , 是 单独 的 一 
类 。 这 里 不 对 算法 做 过 多 介绍 ,我 们 直接 使 用 决策 树 。 简 单 地 说 ,决策 树 有 点 像 过, 通过 一 
系列 的 判断 得 到 最 终结 果 。 

比如 我 们 将 所 有 数据 传 给 决策 树 后 ,决策 树 就 会 根据 数据 进行 学 习 , 并 得 到 自己 的 判 
断 标准 ,这 时 我 们 再 给 它 一 个 新 的 数据 , 它 就 会 给 出 预测 结果 。 比 如 给 它 的 数据 中 大 于 等 
于 150 克 且 粗糙 的 是 橘子 , 当 你 给 它 一 个 大 于 等 于 150 克 且 粗糙 的 数据 , 它 可 能 就 会 预测 为 
橘子 。 说 可 能 ,是 因为 训练 数据 比较 少 , 不 一 定 精准 ,比如 给 它 一 个 3000 克 粗 糙 的 数据 , 它 
可 能 会 告诉 你 这 是 苹果 。 

最 终 代码 如 下 : 


#sk AppleOrange.py 

from sklearn import tree 

mm 

Orange->1 

Apple->0 

features = [[150, ‘bumpy'], [170, 'bumpy'], 
[130, 'smooth'], [140, 'smooth']] 
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features = [[150, 0], [170, 0], [130, 1], [140, 1]] 

labels = [1, 1, 0, 0] 

clf = tree.DecisionTreeClassifier() # 生 成 决策 树 分 类 器 
clf =cl1f.fit (features, labels) # 训 练 分 类 器 
print (clf.predict([[160,0]])) 


这 段 代 码 实际 只 有 6 行 : 

(1) 从 sklearn 中 导入 了 决策 树 tree。 

(2) 定义 了 特征 。 

(3) 定义 了 标签 。 

(4) 生成 决策 树 分 类 器 。 

(5) 输入 数据 训练 分 类 器 。 

(6) 提供 一 个 新 的 数据 让 分 类 器 作 预 测 。 

最 终 的 结果 ,请 你 动手 试 一 下 吧 。 

通过 这 个 简单 的 过 程 ,希望 能 够 让 你 对 机 器 学 习 有 一 个 初步 了 解 , 如 果 想 深入 学 习 机 
器 学 习 , 也 不 会 那么 丽 惧 ,Python 提供 了 很 好 的 工具 ,你 要 做 的 就 是 一 点 一 点 地 在 实践 中 学 
习 了 。 


| 时 重点 提示 


在 这 一 章 中 ,你 要 掌握 的 内 容 : 

本 章 所 介绍 的 内 容 可 以 作为 机 器 学 习 的 启蒙 内 容 ,希望 能 够 让 你 对 机 器 学 习 有 一 个 跨 
过 门槛 的 认识 。 如 果 想 要 深入 研究 机 器 学 习 , 就 不 是 本 书 的 目的 了 ,可 以 再 参考 其 他 专业 
机 器 学 习 的 书籍 。 


3 动 动手 
尝试 本 章 的 代码 ,初步 体会 一 下 机 器 学 习 吧 。 
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features = [[150, 0], [170, 0], [130, 1], [140, 1]] 

labels = [1, 1, 0, 0] 

clf = tree.DecisionTreeClassifier() # 生 成 决策 树 分 类 器 
clf =cl1f.fit (features, labels) # 训 练 分 类 器 
print (clf.predict([[160,0]])) 


这 段 代 码 实际 只 有 6 行 : 

(1) 从 sklearn 中 导入 了 决策 树 tree。 

(2) 定义 了 特征 。 

(3) 定义 了 标签 。 

(4) 生成 决策 树 分 类 器 。 

(5) 输入 数据 训练 分 类 器 。 

(6) 提供 一 个 新 的 数据 让 分 类 器 作 预 测 。 

最 终 的 结果 ,请 你 动手 试 一 下 吧 。 

通过 这 个 简单 的 过 程 ,希望 能 够 让 你 对 机 器 学 习 有 一 个 初步 了 解 , 如 果 想 深入 学 习 机 
器 学 习 , 也 不 会 那么 丽 惧 ,Python 提供 了 很 好 的 工具 ,你 要 做 的 就 是 一 点 一 点 地 在 实践 中 学 
习 了 。 


| 时 重点 提示 


在 这 一 章 中 ,你 要 掌握 的 内 容 : 

本 章 所 介绍 的 内 容 可 以 作为 机 器 学 习 的 启蒙 内 容 ,希望 能 够 让 你 对 机 器 学 习 有 一 个 跨 
过 门槛 的 认识 。 如 果 想 要 深入 研究 机 器 学 习 , 就 不 是 本 书 的 目的 了 ,可 以 再 参考 其 他 专业 
机 器 学 习 的 书籍 。 


3 动 动手 
尝试 本 章 的 代码 ,初步 体会 一 下 机 器 学 习 吧 。 
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